现象描述
无线终端存在网络延迟、卡顿等网络慢的现象。
可能原因
确认问题发生在有线侧还是无线侧:
无线侧:
- VLAN配置不合理。
- AP信道利用率不正常。
- AP报文缓存资源以及发包队列不正常。
- AP信号强度不正常。
- AP内部存在丢包。
- 有低速率用户做大流量业务。
有线侧:
- 中间网络存在ARP丢包。
- 有线网络中存在环路。
- 设备CPU利用率不正常。
- AP的IP地址冲突。
- 网线有问题。
原因检查操作步骤
1、通过ping包确定故障范围是否在网关以下网络
在处理故障之前,通过ping包的方式来确认故障的范围,从而明确故障排查的范围。
# 从STA分别ping网关和外网地址,观察ping包的情况,从而确定故障范围。
- 如果从STA ping网关出现不稳定的情况,如频繁丢包、延迟波动等,说明故障出现在网关以下的网络中。
- 如果从STA ping网关正常,但是ping外网地址出现不稳定的情况,说明故障出现在网关以上的网络中。
如果Ping包过程中出现丢包的情况,可以参考如下内容进行排查:
- 有线侧丢包:终端用户Ping不通网关(有线侧丢包)
- 无线侧丢包:STA丢包(无线侧丢包)
2、检查AP与网关之间有线网络是否正常
# 从网关ping连接AP的交换机,观察ping包情况。
- 如果网关与交换机之间ping包稳定,说明网关与交换机之间有线网络正常。请从3开始排查无线侧网络问题。
- 如果网关与交换机之间ping包不稳定,说明需要排查网关与交换机之间有线网络的故障。请从13开始排查有线侧网络问题。
如果无法从网关ping交换机(如交换机作为纯二层设备),可以从AC ping AP,也能一定程度反映有线网络是否有问题。
3、检查业务VLAN和管理VLAN配置是否合理
管理VLAN和业务VLAN在不同转发方式下的配置推荐如下表所示。
表1 管理VLAN和业务VLAN在不同转发方式下的配置推荐
转发方式 |
业务VLAN |
管理VLAN |
配置影响 |
配置推荐 |
---|---|---|---|---|
直接转发 |
1 |
100 |
用户业务报文打上管理VLAN,导致业务混乱。 |
不推荐 |
100 |
1 |
可能会受VLAN1广播域过大、广播泛洪的影响,导致网络阻塞,影响用户体验。 |
不推荐 |
|
1 |
1 |
可能会受VLAN1广播域过大、广播泛洪的影响,导致网络阻塞,影响用户体验。 |
不推荐 |
|
100 |
100 |
数据转发异常。 |
不推荐 |
|
100 |
50 |
标准推荐配置。 |
推荐 |
|
隧道转发 |
1 |
100 |
可能会受VLAN1广播域过大、广播泛洪的影响,导致网络阻塞,影响用户体验。 |
不推荐 |
100 |
1 |
可能会受VLAN1广播域过大、广播泛洪的影响,导致网络阻塞,影响用户体验。 |
不推荐 |
|
1 |
1 |
MAC漂移,导致数据转发异常。 |
不推荐 |
|
100 |
100 |
MAC漂移,导致数据转发异常。 |
不推荐 |
|
100 |
50 |
标准推荐配置。 |
推荐 |
a、执行命令display vlan brief查看VLAN ID与端口的对应关系。
display vlan brief U:Up;D:Down;TG:Tagged;UT:Untagged; VID Name Status Ports -------------------------------------------------------------------------------- 1 enable UT: Eth-Trunk60(D) Eth-Trunk62(D) Eth-Trunk63(D) GE0/0/1(U) GE0/0/2(D) GE0/0/3(D) GE0/0/4(D) GE0/0/5(D) GE0/0/6(D) GE0/0/7(D) GE0/0/8(D) GE0/0/9(D) GE0/0/10(D) GE0/0/11(D) GE0/0/12(D) GE0/0/13(D) GE0/0/14(D) GE0/0/15(D) GE0/0/16(D) GE0/0/17(D) GE0/0/18(D) GE0/0/19(D) GE0/0/20(D) GE0/0/21(D) GE0/0/22(D) GE0/0/23(D) GE0/0/24(U) XGE0/0/1(D) XGE0/0/2(D) 10 enable 11 enable
b、执行命令interface GigabitEthernet 0/0/x进入端口,检查各接口下管理VLAN和业务VLAN的配置是否合理。
如果管理VLAN和业务VLAN的配置不合理,如同时使用VLAN1作为业务VLAN和管理VLAN,请参考表1进行配置。
system-view [AC] interface GigabitEthernet 0/0/5 [AC-GigabitEthernet0/0/5] display this # interface GigabitEthernet0/0/5 port link-type trunk port trunk pvid vlan 100 port trunk allow-pass vlan 100 # return
4、检查AP的CPU利用率是否正常
如果设备的CPU利用率一直很高(超过80%),会导致各种业务异常,出现丢包、网络延迟大等现象。
# 在AP上查看AP的CPU利用率,确认AP的CPU利用率是否正常。
system-view [AP] diagnose [AP-diagnose] display cpu-usage CPU Usage Stat. Cycle: 10 (Second) usr: 1.8% sys: 0.9% irq: 0.0% softIrq: 0.9% CPU Usage: 3.6% Max: 80.1% CPU Usage Stat. Time : 2005-07-27 19:12:04 CPU Usage Max. Time : 2005-07-27 19:02:40
造成设备CPU利用率高的原因有很多,请参考CPU占用率高处理。
5、检查AP的信道利用率是否正常
WLAN网络中所有终端共享带宽,相互竞争带宽资源,如果周围环境中无线终端很多,或网络中有很多广播、组播报文(组播、广播报文都是低速率发送,消耗空口资源多),相互抢占信道的情况就会很严重,最终导致信道利用率高,无线网络不稳定,出现ping包延迟大、丢包等情况。
- AC+FIT AP场景
# 在AC上执行命令display radio all,查看AP所在信道的信道利用率,确认AP的信道利用率是否正常。
对于AC+中心AP+RU的场景,在AC上查询RU的信道利用率时,需要在WLAN视图下执行命令ap data-collection enable开启RU数据缓存功能。
display radio all CH/BW:Channel/Bandwidth CE:Current EIRP (dBm) ME:Max EIRP (dBm) CU:Channel utilization ST:Status WM:Working Mode (normal/monitor/monitor dual-band-scan/monitor proxy dual-band-scan) ------------------------------------------------------------------------------------ AP ID Name RfID Band Type ST CH/BW CE/ME STA CU WM ------------------------------------------------------------------------------------ 0 60de-4474-9640 0 2.4G bgn on 6/20M 24/24 0 55% normal 0 60de-4474-9640 1 5G an on 56/20M 25/25 0 3% normal ------------------------------------------------------------------------------------ Total:2
- FAT AP场景
# 执行命令display ap traffic statistics wireless radio radio-id,查看AP所在信道的信道利用率,确认AP的信道利用率是否正常。
对于FAT中心AP+RU的场景,在FAT中心AP上查询RU的信道利用率时,需要在WLAN视图下执行命令ap data-collection enable开启RU数据缓存功能。
<Huawei> display ap traffic statistics wireless radio 0 ----------------------------------------------------------------------- ... Wireless channel utilization(%) :70 ... -----------------------------------------------------------------------
一般情况下,如果信道利用率超过60%,则可能会对用户造成网络波动。导致信道利用率高的原因和解决方法如下:
- 无线网络环境干扰严重,此时,需要对AP的信道进行合理的规划,降低干扰。可以手动将信道切换至信道利用率低的信道,或者在无业务影响时进行调优操作。
- 网络中组播、广播报文很多,此时,需要查看网络中的组播、广播报文的情况,具体请参见8。
6、检查AP系统报文缓存资源的剩余可用buffer资源是否正常
AP的转发模块和Wi-Fi收发包模块共用一个buffer资源池,如果buffer资源不足,会出现丢包的情况。
# 在AP上执行命令display memory-pool info查看AP系统报文缓存资源,确认剩余可用buffer资源是否正常。
<AP> system-view [AP] diagnose [AP-diagnose] display memory-pool info ... Show PBuf Buffer Pool info : ============== BufMan Info =================== BufMan Shm Addr[0x42600000], Shm Size[0x1e00000], L1 Num[64], L1 in use[6] Buffer Num[13358], each buffer has [0x900] bytes L1 stack info: Offset = 0x130, L2Offset = 0xd728, num = 128, SP = 38 L1 stack info: Offset = 0x344, L2Offset = 0xd728, num = 0, SP = 0 L1 stack info: Offset = 0x358, L2Offset = 0xd728, num = 4, SP = 0 L1 stack info: Offset = 0x37c, L2Offset = 0xd728, num = 16, SP = 0 L1 stack info: Offset = 0x3d0, L2Offset = 0xd728, num = 16, SP = 0 L1 stack info: Offset = 0x424, L2Offset = 0xd728, num = 0, SP = 0 L2 stack info: Offset = 0xd728, len = 0x4000 front = 13014, rear = 2630, available = 6000
如果AP剩余可用的buffer资源在100以下,则认为AP的buffer资源不足,会出现丢包的情况。此时,请联系技术支持人员寻求技术支持。
7、检查发包队列是否存在拥塞或者被占满的情况
报文到达AP Wi-Fi驱动模块后,会先缓存在队列中等待调度发送,如果Wi-Fi驱动模块缓存队列被占满或者拥塞严重,则会出现丢包、延迟大的情况。
AP Wi-Fi驱动模块的缓存队列出现拥塞,肯定是被某些终端占用了,常见的如终端信号弱、离开Wi-Fi覆盖区域等场景,都会导致发给此终端的报文无法顺利发出,而堵塞在AP的缓存队列中。
a、在AP上查看AP的Wi-Fi驱动模块发包队列情况,确认发包队列是否存在拥塞或者被占满的情况。
- 对于仅支持11n类型的AP,如AP6x10xN,查看AP的Wi-Fi驱动模块发包队列情况。
V200R006C10及之前版本命令行:display interface radio radio-id txq-buf
V200R006C20及之后版本命令行:display wifi txq-buf radio radio-id 。以此为例。
<AP> system-view [AP] diagnose [AP-diagnose] display wifi txq-buf radio 0 [txqbuf] ath_softc free buf:1024 tx queue depth :1024 txq 0:buf_used = 0 minfree = 48 aggr_depth = 0 axq_depth = 0 txq 1:buf_used = 0 minfree = 32 aggr_depth = 0 axq_depth = 0 txq 2:buf_used = 0 minfree = 16 aggr_depth = 0 axq_depth = 0 txq 3:buf_used = 0 minfree = 0 aggr_depth = 0 axq_depth = 0 txq 4:buf_used = 0 minfree = 0 aggr_depth = 0 axq_depth = 0 txq 5:buf_used = 0 minfree = 0 aggr_depth = 0 axq_depth = 0 txq 6:buf_used = 0 minfree = 0 aggr_depth = 0 axq_depth = 0 txq 7:buf_used = 0 minfree = 0 aggr_depth = 0 axq_depth = 0 txq 8:buf_used = 0 minfree = 48 aggr_depth = 0 axq_depth = 0 txq 9:buf_used = 0 minfree = 0 aggr_depth = 0
- 对于仅支持11ac类型的AP,如AP5x30xN,查看AP的Wi-Fi驱动模块发包队列情况。
V200R006C10版本命令行:debugging wlandrv setplv printlevel_num
V200R006C20版本命令行:debugging wifi trace-print level printlevel_num
V200R007及之后版本命令行:display wifi txq-buf radio radio-id。以此为例。
<AP> system-view [AP] diagnose [AP-diagnose] display wifi txq-buf radio 1 [Txqbuf] Host tx queue depth:2500 [Frames queued to hwq] -------------------------------------- Q0 Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8 Q9 1 0 0 0 0 0 0 0 0 0 -------------------------------------- [Tid queue stats] SW queue stats <---> HW queue stats ------------------------------ TID 0 0 0 TID 1 0 0 TID 2 0 0 TID 3 0 0 TID 4 0 0 TID 5 0 0 TID 6 0 0 TID 7 0 0 TID 8 0 0 TID 9 0 0 TID 10 0 0 TID 11 0 0 TID 12 0 0 TID 13 0 0 TID 14 0 0 TID 15 0 0 TID 16 0 0 TID 17 0 0 TID 18 0 1 TID 19 0 0 ------------------------------ [Prefetch Tx queue stats] ------------------------------ TID 0 0 TID 1 0 TID 2 0 TID 3 0 TID 4 0 TID 5 0 TID 6 0 TID 7 0 ------------------------------
- 对于支持11ax类型的AP,如AirEngine8760-X1-PRO,查看AP的Wi-Fi驱动模块发包队列情况。
V200R019C10版本命令行:display lmac txq-buf radio radio-id
[AP-diagnose] display lmac txq-buf radio 1 Hardware tx queue statistic: ------------------------------------------------------------------ Txq0 Txq1 Txq2 Txq3 Txq4 Txq5 Txq6 Txq7 Total 0 0 0 0 0 0 0 0 ------------------------------------------------------------------ Txq8 Txq9 Txq10 Txq11 Txq12 Txq13 Txq14 Txq15 Total 0 0 0 0 0 0 0 0 ------------------------------------------------------------------ Software tid queue statistic: ------------------------------------------------------------------ Tid0 Tid1 Tid2 Tid3 Tid4 Total 0 0 0 0 0 ------------------------------------------------------------------ Tid5 Tid6 Tid7 Tid8 Tid9 Total 0 0 0 0 0 ------------------------------------------------------------------ Qos queue statistic: ------------------------------------------------------------------ BE BK VI VO Total 0 0 0 0 ------------------------------------------------------------------
一般情况下,Wi-Fi驱动模块的缓存队列基本处于0占用的状态,不会持续处于被占用的情况,所以如果上述显示信息中的字段数字维持在100以上,则说明队列出现了拥塞的情况。此时,请联系技术支持人员寻求技术支持。
b、如果AP Wi-Fi驱动模块的缓存队列出现拥塞,查看每个终端占用队列的具体情况。
V200R006C10及之前版本命令行:display sta-statistics radio radio-id list。
V200R006C20~V200R019C00版本命令行:display wifi sta-statistics radio radio-id。以此为例。
<AP> system-view [AP] diagnose [AP-diagnose] display wifi sta-statistics radio 1 ADDR AID CHAN TXRATE RXRATE RSSI IDLE TXSEQ RXSEQ SKIP NORML CAPS ACAPS ERP STATE HTCAPS 9cfc-013a-a9d3 1 149 78M 78M 56 0 0 65535 0 0 E 0 1400001b AWQ --------------------------STA:8038-bc1b-8850 Statistics------------------------- [NorMalPS] sendPktAsNiPsUmac : 0 [RateFind Lastest Info] GoodPut(kbps) : 0 Per : 0% RateCode : 0x0 --------------------------STA:9cfc-013a-a9d3 Statistics------------------------- [NorMalPS] sendPktAsNiPsUmac : 0 [ap-yuan-diagnose] [RateFind Lastest Info] GoodPut(kbps) : 70492 Per : 0% RateCode : 0xc8 ---------------------------STA:8038-bc1b-8850 TidInfo--------------------------- [tidno: 17] wal_txq_id : 4 is_registered_for_hwq_empty : 0 sw_retry_failure : 0 tx_header_size : 0 tid_flags : 0x3da0 pause_module_id_map : 0 block_module_id_map : 0 tid_winsn : 0x0 tid_startsn : 800 tid_winunack : 0x0 tid_frameqhead : 0 tid_frameqaddr : 0 num_mpdu_in_frameq : 0 num_mpdu_in_hwq : 0 tid_frameqlastnum : 0 tid_frameqlastpad : 0 total_mpdus_allowed : 0 allow_n_flags : 0 win_credit : 1 win_size_o : 1 fail_cnt_succ : 0 pn_low : 0xffffffffffffffff [tidno: 18] wal_txq_id : 6 is_registered_for_hwq_empty : 0 sw_retry_failure : 0 tx_header_size : 0 tid_flags : 0x2da0 pause_module_id_map : 0 block_module_id_map : 0 tid_winsn : 0xffffffffffffffff tid_startsn : 3880 tid_winunack : 0x0 tid_frameqhead : 4445124 tid_frameqaddr : 4445124 num_mpdu_in_frameq : 0 num_mpdu_in_hwq : 0 tid_frameqlastnum : 1 tid_frameqlastpad : 3 total_mpdus_allowed : 0 allow_n_flags : 0 win_credit : 1 win_size_o : 1 fail_cnt_succ : 0 pn_low : 0xffffffffffffffff [tidno: 16] wal_txq_id : 1 is_registered_for_hwq_empty : 1 sw_retry_failure : 0 tx_header_size : 10 tid_flags : 0x3dc2 pause_module_id_map : 2048 block_module_id_map : 0 tid_winsn : 0x0 tid_startsn : 116 tid_winunack : 0x0 tid_frameqhead : 0 tid_frameqaddr : 0 num_mpdu_in_frameq : 0 num_mpdu_in_hwq : 0 tid_frameqlastnum : 0 tid_frameqlastpad : 0 total_mpdus_allowed : 0 allow_n_flags : 0 win_credit : 1 win_size_o : 1 fail_cnt_succ : 0 pn_low : 0xffffffffffffffff [tidno: 19] wal_txq_id : 1 is_registered_for_hwq_empty : 0 sw_retry_failure : 0 tx_header_size : 0 tid_flags : 0x3da0 pause_module_id_map : 0 block_module_id_map : 0 tid_winsn : 0x0 tid_startsn : 0 tid_winunack : 0x0 tid_frameqhead : 0 tid_frameqaddr : 0 num_mpdu_in_frameq : 0 num_mpdu_in_hwq : 0 tid_frameqlastnum : 0 tid_frameqlastpad : 0 total_mpdus_allowed : 0 allow_n_flags : 0 win_credit : 1 win_size_o : 1 fail_cnt_succ : 0 pn_low : 0xffffffffffffffff
V200R019C10版本命令行:display lmac sta-statistics queue-status radio radio-id
[AP-diagnose] display lmac sta-statistics queue-status radio 1 -------------------------------STA:aab8-3cdb-f2fc------------------------------- Tx tid queue info: Base info: Tid num : 0 1 2 3 4 5 6 7 8 Hardware txq ID : 1 0 0 1 2 2 3 3 11 Tid flag : 0x65 0x1 0x1 0x1 0x1 0x1 0x65 0x1 0x1007 Tid start sn : 1 0 0 0 0 0 1233 0 0 Negotiate window size : 64 1 1 1 1 1 64 1 1 Software retry failure : 0 0 0 0 0 0 0 0 0 Failure count : 0 0 0 0 0 0 0 0 0 MPDU count : 0 0 0 0 0 0 0 0 0 Retrans MPDU count : 0 0 0 0 0 0 0 0 0 MPDU byte : 0 0 0 0 0 0 0 0 0 Retrans MPDU byte : 0 0 0 0 0 0 0 0 0 MSDU num : 0 0 0 0 0 0 0 0 0 MSDU byte : 0 0 0 0 0 0 0 0 0 MPDU total num : 0 0 0 0 0 0 0 0 0 Window credit : 64 1 1 1 1 1 64 1 1 Queue ctrl info: MSDU limit due rate : 25273 0 0 0 0 0 25273 0 0 MSDU limit due dequeue : 26325 0 0 0 0 0 26325 0 0 Max allowed MSDU : 26325 0 0 0 0 0 25273 0 0 MSDU drop due limit : 0 0 0 0 0 0 0 0 0 MSDU timeout threshold(ms): 10000 10000 10000 10000 10000 10000 10000 10000 10000 Fisrt MSDU dwell time : 0 0 0 0 0 0 0 0 0 MSDU drops due expire : 0 0 0 0 0 0 0 0 0 Current time : 72014451 72014451 72014451 72014451 72014451 72014451 72014451 72014451 72014451 Last success send time : 90589 0 0 0 0 0 71988157 0 0 Dequeue MSDU count : 0 0 0 0 0 0 0 0 0 MSDU limit due powersave : 25273 25273 25273 25273 25273 25273 25273 25273 0 Protocal info: Max MSDU num : 1 1 1 1 1 1 1 1 0 Max MSDU byte : 1500 1500 1500 1500 1500 1500 1500 1500 0 Packet type : 0 0 0 0 0 0 0 0 0 Packet encryption type : 0 0 0 0 0 0 0 0 0 Has qos flag : 0 0 0 0 0 0 0 0 0 Has ctrl flag : 0 0 0 0 0 0 0 0 0 Prot info tid flag : 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0 Power save info: Service period start time : 0 0 0 0 0 0 0 0 0 Pause cmd flag : 0 0 0 0 0 0 0 0 0 Su only on flag : 0 0 0 0 0 0 0 0 0 Pending frame sleep : 0 0 0 0 0 0 0 0 0 Power saving info : 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0 Schedule info: Schedule list type : 2 0 0 0 0 0 2 0 0 Tid in schedule : 1 0 0 0 0 0 1 0 0 Tokens num : 1 0 0 0 0 0 0 0 0 Priority : 0 0 0 0 0 0 0 0 0 Schedule abnormal num : 0 0 0 0 0 0 0 0 0 Tid pending status : 0 0 0 0 0 0 0 0 0 Rx pkt seqnumber info: Tid num : 0 1 2 3 4 5 6 7 8 Mask : 0 0 0 0 0 0 0 0 0 Seq num start : 99 0 0 0 0 0 0 0 0 Seq num end : 163 0 0 0 0 0 0 0 0 Seq num : 0x620 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0
发给终端的报文有多个优先级,每个优先级对应一个队列。如上所示的显示信息中,列出了当前AP对应射频上关联的所有终端在每一个队列中占用的buffer数量(num_mpdu_in_frameq),如果该参数的数值维持在20以上,则说明该终端占用了发包队列。此时,请联系技术支持人员寻求技术支持。
8、检查AP接口上接收到的组播和广播报文的统计信息是否正常
WLAN网络中发送组播、广播报文时,因为报文不会重传,所以为了确保接收端的收包成功率,都是以较低速率发送。如果网络中有大量的组播、广播报文往空口发送,会导致空口资源浪费严重,出现信道利用率持续升高,影响无线终端正常的上网体验,出现延迟大、丢包的情况。
# 在AP上查看AP对应接口上接收到的组播和广播报文的统计信息,观察组播、广播报文增长速率。可以多执行几次,观察报文统计计数增长的情况。
<AP> display interface GigabitEthernet 0/0/0 GigabitEthernet0/0/0 current state : UP Line protocol current state : UP Description:HUAWEI, AP Series, GigabitEthernet0/0/0 Interface Switch Port, PVID : 1, TPID : 8100(Hex), The Maximum Frame Length is 1800 IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 8038-bc1b-86c0 Last physical up time : 2005-07-27 19:02:43 UTC+08:00 Last physical down time : 2005-07-27 19:02:27 UTC+08:00 Current system time: 2005-07-27 22:50:31+08:00 Port Mode: COMMON COPPER Speed : 1000, Loopback: NONE Duplex: FULL, Negotiation: ENABLE Mdi : AUTO Last 300 seconds input rate 64 bits/sec, 0 packets/sec Last 300 seconds output rate 120 bits/sec, 0 packets/sec Input peak rate 3320 bits/sec,Record time: 2005-07-27 19:02:47 Output peak rate 7104 bits/sec,Record time: 2005-07-27 19:02:46 Input: 610 packets, 90015 bytes Unicast: 13, Multicast: 244 Broadcast: 352, Jumbo: 0 Discard: 0, Total Error: 0 CRC: 0, Giants: 0 Jabbers: 0, Throttles: 0 Runts: 0, Alignments: 0 Symbols: 0, Ignoreds: 0 Frames: 0 Output: 457 packets, 207021 bytes Unicast: 0, Multicast: 457 Broadcast: 0, Jumbo: 0 Discard: 0, Total Error: 0 Collisions: 0, ExcessiveCollisions: 0 Late Collisions: 0, Deferreds: 0 Buffers Purged: 0 Input bandwidth utilization threshold : 100.00% Output bandwidth utilization threshold: 100.00% Input bandwidth utilization : 0% Output bandwidth utilization : 0%
如果广播或组播报文的增长速率超过100pps,说明该接口接收到的广播、组播报文较多。
解决方法如下:
a、开启二层网络的隔离功能。
# 在交换机或AC的接口下配置接口二层隔离功能。以AC为例。
<AC> system-view [AC] interface GigabitEthernet 0/0/1 [AC-GigabitEthernet0/0/1] port-isolate enable [AC-GigabitEthernet0/0/1] quit
# 在AC的流量模板下配置用户二层隔离功能。
[AC] wlan [AC-wlan-view] traffic-profile name default [AC-wlan-traffic-prof-default] user-isolate l2 [AC-wlan-traffic-prof-default] quit [AC-wlan-view] quit
在交换机或AC上开启接口的广播和组播报文限速功能。以AC为例。
[AC] interface GigabitEthernet 0/0/1 [AC-GigabitEthernet0/0/1] broadcast-suppression packets 1000 [AC-GigabitEthernet0/0/1] multicast-suppression packets 1000
9、通过rf-ping命令检查问题终端的信号强度和速率是否正常
无线终端信号强度弱,会导致收、发包出现重传的情况。无线通信系统的速率是动态变化的,重传会导致发送端降速来确保通信成功率。
导致无线信号强度弱的常见原因包括:
- 终端与AP之间存在障碍物,如墙体、建筑物等。
- 终端所处区域内没有规划AP进行覆盖。
- 终端与AP之间的物理距离较远。
排查步骤如下:
a、在AC上执行命令rf-ping -c number sta-mac,查看问题终端的信号强度和速率,确认无线侧通信是否顺畅。
<AC> system-view [AC] wlan [AC-wlan-view] rf-ping -c 10 183d-a27a-0570 Info: RfPing start, press CTRL+C to break. Tx rate=130.0 Mbps, Reply from 183d-a27a-0570: RSSI=-43 dBm time < 1 ms Tx rate=130.0 Mbps, Reply from 183d-a27a-0570: RSSI=-43 dBm time < 1 ms Tx rate=130.0 Mbps, Reply from 183d-a27a-0570: RSSI=-46 dBm time < 1 ms Tx rate=130.0 Mbps, Reply from 183d-a27a-0570: RSSI=-46 dBm time < 1 ms Tx rate=130.0 Mbps, Reply from 183d-a27a-0570: RSSI=-42 dBm time < 1 ms Tx rate=130.0 Mbps, Reply from 183d-a27a-0570: RSSI=-44 dBm time=1 ms Tx rate=130.0 Mbps, Reply from 183d-a27a-0570: RSSI=-44 dBm time=1 ms Tx rate=130.0 Mbps, Reply from 183d-a27a-0570: RSSI=-43 dBm time < 1 ms Tx rate=130.0 Mbps, Reply from 183d-a27a-0570: RSSI=-42 dBm time < 1 ms Tx rate=130.0 Mbps, Reply from 183d-a27a-0570: RSSI=-43 dBm time < 1 ms 10 packets transmitted, 10 received, 0% packet loss, time < 1 ms, RSSI -43 dBm
如上所示的显示信息中,需要关注发包速率(Tx rate)和信号强度(RSSI):
- 在信号强度正常的情况下,如果速率反复变化,说明网络中存在无线干扰,需要对AP进行信道规划和功率调整。
- 如果终端信号强度低于-70dBm,说明终端信号强度弱,需要查看Wi-Fi网络覆盖是否存在盲区,如果存在,需要补盲解决。同时还需要查看AP是否分布密集,如果是,建议调整功率或者调整AP位置,保证漫游体验。
b、在AC上执行命令display station sta-mac sta-mac,查看终端是否关联到远端AP。
<AC> display station sta-mac b878-2eb4-2689 ------------------------------------------------------------------------------ ... The upstream SNR(dB) : 80.0 ... Neighbor list: ------------------------------------------ AP name RfID SNR RCPI ------------------------------------------ ------------------------------------------ total: 0 ... ------------------------------------------------------------------------------
如果邻居列表中存在SNR比STA当前关联的AP的SNR高,则说明终端可能关联到了远端AP,建议开启智能漫游功能。配置如下:
<AC> system-view [AC] wlan [AC-wlan-view] rrm-profile name wlan-rrm [AC-wlan-rrm-prof-wlan-rrm] smart-roam enable //从V200R008版本开始,智能漫游功能默认是开启的,如被关闭,可以执行命令undo smart-roam disable开启
10、通过报文跟踪手段检查AP设备内部是否存在丢包
a、从AC ping终端,通过报文跟踪功能来跟踪icmp报文从网络侧到终端侧的发送情况。
V200R006C20及之后版本执行命令行:
<AP> system-view [AP] diagnose [AP-diagnose] debugging wifi pkt-print clear //清空当前过滤条件,便于重新设置过滤条件 [AP-diagnose] debugging wifi pkt-print counter clear //清空当前计数,方便查看新的计数 [AP-diagnose] debugging wifi pkt-print condition icmp //设置过滤条件 [AP-diagnose] debugging wifi pkt-print condition dst-mac 482c-a042-6e54 //设置过滤条件,目的MAC地址是终端的MAC地址 [AP-diagnose] debugging wifi pkt-print on print-num 1000 //设置最多统计多少个满足条件的报文 [AP-diagnose] debugging wifi pkt-print counter query //查看统计计数 ID CNT SEQ TIME WIFI_PKT_PROC_KAP_TX_HOOK 5 0 2018-9-28 10:38:49 WIFI_PKT_PROC_TX_DATA_COMPLETE_OK 5 0 2018-9-28 10:38:49
V200R006C10及之前版本执行如下命令行:
<AP> system-view [AP] diagnose [AP-diagnose] debugging wifi print condition clear //清空当前过滤条件,便于重新设置过滤条件 [AP-diagnose] debugging wifi print condition counter clear //清空当前计数,方便查看新的计数 [AP-diagnose] debugging wifi print 3 //配置为3表示只统计报文,不打印报文内容 [AP-diagnose] debugging wifi print condition icmp //设置过滤条件 [AP-diagnose] debugging wifi print condition dst-mac 2469-a593-6d9a //设置过滤条件,目的MAC地址是终端的MAC地址 [AP-diagnose] debugging wifi print on print-num 1000 //设置最多统计多少个满足条件的报文 [AP-diagnose] debugging wifi print condition counter query //查看统计计数 ID CNT SEQ TIME WIFI_PKT_PROC_KAP_TX_HOOK 10 0 2015-5-29 1:26:41 WIFI_PKT_PROC_OSIF_START 10 0 2015-5-29 1:26:41 WIFI_PKT_PROC_VAP_SEND 10 0 2015-5-29 1:26:41 WIFI_PKT_PROC_SEND_WBUF_INTER 10 0 2015-5-29 1:26:41 WIFI_PKT_PROC_TX_SEND 10 0 2015-5-29 1:26:41 WIFI_PKT_PROC_TX_START 10 0 2015-5-29 1:26:41 WIFI_PKT_PROC_ATH_TX_START_DMA 10 0 2015-5-29 1:26:41 WIFI_PKT_PROC_TX_START_DMA_AMPDU 10 0 2015-5-29 1:26:41 WIFI_PKT_PROC_WIFI_IEEE80211_UPDATE_STATUS_OK 10 0 2015-5-29 1:26:41
如上面显示信息所示,最上面的一项是报文进入Wi-Fi驱动模块时的计数统计,后面的依次是报文经过Wi-Fi驱动模块的各个发送流程,直至发送成功。正常情况下,各个流程的计数统计应该是一样的,如果不一样或全为0,说明Wi-Fi驱动模块存在丢包或没有收到报文。
b、从AC ping终端,通过报文跟踪功能来跟踪终端的icmp响应报文从终端侧到网络侧的发送情况。
V200R019C10版本执行命令行:
[AP-diagnose] debugging lmac pkt-print on print-num 1000 [AP-diagnose] debugging lmac pkt-print condition icmp [AP-diagnose] debugging lmac pkt-print counter clear [AP-diagnose] debugging lmac pkt-print counter query ID CNT SEQ TIME Tx all receive data pkt from cap 22 0 3359060104 Tx all receive mgmt pkt from umac 725 0 3359060498 Tx receive specific data pkt from cap 21 0 3359060104 Tx specific data pkt enqueue 21 0 3359060105 Tx send specific msdu to smac 28 0 3359059603 Tx specific msdu done 28 0 3359059604 Rx all receive mgmt pkt from smac 52 0 3359056177 Rx all receive data pkt from smac 31 0 3359059606 Rx send specific data pkt to cap 20 0 3359059606
V200R006C20~V200R019C00版本执行命令行:
<AP> system-view [AP] diagnose [AP-diagnose] debugging wifi pkt-print clear //清空当前过滤条件,便于重新设置过滤条件 [AP-diagnose] debugging wifi pkt-print counter clear //清空当前计数,方便查看新的计数 [AP-diagnose] debugging wifi pkt-print condition icmp //设置过滤条件 [AP-diagnose] debugging wifi pkt-print condition source-mac 482c-a042-6e54 //设置过滤条件,源MAC地址是终端的MAC地址 [AP-diagnose] debugging wifi pkt-print on print-num 1000 //设置最多统计多少个满足条件的报文 [AP-diagnose] debugging wifi pkt-print counter query //查看统计计数 ID CNT SEQ TIME WIFI_PKT_PROC_WIFI_RECV_PROCESS 5 0 2018-9-28 10:48:56 WIFI_RX_AMSDU_POP_LL 5 0 2018-9-28 10:48:56 WIFI_RX_AMSDU_RX_PN_OK 5 0 2018-9-28 10:48:56 WIFI_RX_AMSDU_RX_DELIVERS 5 0 2018-9-28 10:48:56 WIFI_RX_AMSDU_RECEIVE_HOOK 10 0 2018-9-28 10:48:56 WIFI_RXFILTER_DROPUNENC_ACCEPT 5 0 2018-9-28 10:48:56
V200R006C10及之前版本执行如下命令行:
system-view [AP] diagnose [AP-diagnose] debugging wifi print condition clear //清空当前过滤条件,便于重新设置过滤条件 [AP-diagnose] debugging wifi print condition counter clear //清空当前计数,方便查看新的计数 [AP-diagnose] debugging wifi print 3 //配置为3表示只统计报文,不打印报文内容 [AP-diagnose] debugging wifi print condition icmp //设置过滤条件 [AP-diagnose] debugging wifi print condition src-mac 2469-a593-6d9a //设置过滤条件,源MAC地址是终端的MAC地址 [AP-diagnose] debugging wifi print on print-num 1000 //设置最多统计多少个满足条件的报文 [AP-diagnose] debugging wifi print condition counter query //查看统计计数 ID CNT SEQ TIME WIFI_PKT_PROC_WIFI_RECV_PROCESS 10 0 2015-5-29 1:37:11 WIFI_PKT_PROC_MESH_DATA_RECV 10 0 2015-5-29 1:37:11 WIFI_PKT_PROC_DELIVER_DATA 10 0 2015-5-29 1:37:11 WIFI_PKT_PROC_ATH_AMPDU_INPUT 10 0 2015-5-29 1:37:11 WIFI_PKT_PROC_ATH_AMPDU_INPUT_RX_IN_ORDER 10 0 2015-5-29 1:37:11 WIFI_PKT_PROC_RX_NET80211_RX 10 0 2015-5-29 1:37:11 WIFI_PKT_PROC_RX_PROCESS 10 0 2015-5-29 1:37:11 WIFI_PKT_PROC_RECV_KEYHAS_OK 10 0 2015-5-29 1:37:11 WIFI_PKT_DROP_RX_NET80211_RX_KEYMISS 10 0 2015-5-29 1:37:11 WIFI_PKT_DROP_INPUT_DATA_MCASTECHO 10 0 2015-5-29 1:37:11
如上面显示信息所示,最下面的一项是报文进入Wi-Fi驱动模块时的计数统计,后面的依次是报文经过Wi-Fi驱动模块的各个接收流程,直至发送到转发模块。正常情况下,各个流程的计数统计应该是一样的,如果不一样或全为0,说明Wi-Fi驱动模块存在丢包或没有收到报文。
如果报文在设备内部收发过程中存在丢包,请联系华为技术支持人员寻求技术支持。
c、问题处理结束后关闭报文跟踪功能。
V200R019C10版本执行如下命令行:
[AP-diagnose] debugging lmac pkt-print condition clear //清空当前过滤条件 [AP-diagnose] debugging lmac pkt-print off //关闭统计开关
V200R006C20~V200R019C00版本执行命令行:
[AP-diagnose] debugging wifi pkt-print clear //清空当前过滤条件 [AP-diagnose] debugging wifi pkt-print off //关闭统计开关
V200R006C10及之前版本执行如下命令行:
[AP-diagnose] debugging wifi print condition clear //清空当前过滤条件 [AP-diagnose] debugging wifi print off //关闭统计开关
11、检查是否关闭WMM功能
在AC上查看AP的射频模板,检查是否关闭了WMM功能。如果WMM功能被关闭,当前终端的速率只能为802.11g的速率,此时,需要开启WMM功能。
display radio-5g-profile name default ------------------------------------------------------------ ...... WMM switch : disable ...... ------------------------------------------------------------ system-view [AC] wlan [AC-wlan-view] radio-5g-profile name default [AC-wlan-radio-5g-prof-default] undo wmm disable
12、检查是否存在建链速率低的终端在做大流量业务
AP下关联低速率下做大流量业务的终端,可能会导致该AP下的其他用户无法正常上网,该终端停止业务后,其他用户恢复正常。
a、通过display station ap-id X 查看该AP下是否存在建链速率低的终端。
display station ap-id 3 Rf/WLAN: Radio ID/WLAN ID Rx/Tx: link receive rate/link transmit rate(Mbps) ----------------------------------------------------------------------------------------------------------------- STA MAC AP ID Ap name Rf/WLAN Band Type Rx/Tx RSSI VLAN IPv4 address SSID Status ----------------------------------------------------------------------------------------------------------------- 14cf-9208-9abf 0 1047-8007-6f80 0/2 2.4G 11n 65/58 -70 10 10.10.10.253 tap1 Normal ----------------------------------------------------------------------------------------------------------------- Total: 1 2.4G: 1 5G: 0
在有业务的情况下,如果终端的建链速率(Tx或Rx)小于30Mbps,说明该终端的建链速率低。
b、执行命令display station statistics sta-mac sta-mac查看该终端下的统计。
display station statistics sta-mac 14cf-9208-9abf ----------------------------------------------------------------- Packets sent to the station : 7 Packets received from the station : 40 Bytes sent to the station : 1170 Bytes received from the station : 3911 Wireless data rate sent to the station(kbps) : 0 Wireless data rate received from the station(kbps) : 0 Trigger roam total : 0 Trigger roam failed : 0 STA power save percent : 0% ------------------------------------------------------------------------------
一般认为,如果终端流量超过10M,说明该终端在进行大流量业务。具体还需要结合实际网络情况来判断。
为保证其他终端能够正常上网,可以通过如下方法进行处理:
- 对单个终端进行限速,具体的限制速率请结合实际网络情况来配置。
system-view [AC] wlan [AC-wlan-view] traffic-profile name p1 [AC-wlan-traffic-prof-p1] rate-limit client up 2000 [AC-wlan-traffic-prof-p1] rate-limit client down 2000
- 开启智能漫游功能。
system-view [AC] wlan [AC-wlan-view] rrm-profile name wlan-rrm [AC-wlan-rrm-prof-wlan-rrm] smart-roam enable //从V200R008版本开始,智能漫游功能默认是开启的,如被关闭,可以执行命令undo smart-roam disable开启
13、检查有线网络侧中间设备是否存在ARP丢包
如果中间设备ARP丢包严重,会导致通信双方无法及时学习到对方的ARP表项,出现网络时通时断的异常情况。
# 在中间设备(如交换机)上执行命令display cpu-defend statistics wired,检查中间设备ARP CPCAR丢包情况。
display cpu-defend statistics wired ----------------------------------------------------------------------- Packet Type Pass Packets Drop Packets ----------------------------------------------------------------------- 8021X 0 0 arp-miss 0 0 arp-reply 0 0 arp-request 6 0 capwap 0 0 capwap-association 0 0 capwap-discovery 0 0 capwap-echo 0 0 capwap-keepalive 0 0 dhcp-client 0 0
如果ARP Request包的丢包率超过50%,说明该中间设备ARP丢包严重。
解决方法如下:
- 在设备当前CPU利用率不高的情况下,可以增大ARP Request报文上送CPU的限制速率。
system-view [LSW] cpu-defend policy test //创建策略 [LSW-cpu-defend-policy-test] packet-type arp-request rate-limit 256 wired //调整ARP Request报文的限制速率 [LSW-cpu-defend-policy-test] quit [LSW] cpu-defend-policy test //应用策略
- 配置攻击溯源功能,避免网络中有终端存在ARP泛洪攻击行为。
[LSW] cpu-defend policy test [LSW-cpu-defend-policy-test] auto-defend protocol arp [LSW-cpu-defend-policy-test] auto-defend threshold 50 //设置攻击溯源检查阈值为50pps,如果超过该阈值,则认为被攻击 [LSW-cpu-defend-policy-test] auto-defend action deny timer 60 //检测到攻击后,直接丢弃报文并将终端加入黑名单60s [LSW-cpu-defend-policy-test] quit [LSW] cpu-defend-policy test //应用策略
14、检查有线网络中是否存在环路
如果网络中存在环路,会导致MAC漂移、网络拥塞严重等问题,引起通信不畅,出现丢包、网络延迟大等现象。
a、在交换机上执行命令display interface brief,查看设备接口报文统计信息,观察入方向和出方向的流量。
[LSW] display interface brief PHY: Physical *down: administratively down (l): loopback (s): spoofing (b): BFD down (e): ETHOAM down InUti/OutUti: input utility/output utility Interface PHY Protocol InUti OutUti inErrors outErrors GigabitEthernet0/0/1 down down 0% 0% 0 0 GigabitEthernet0/0/2 up up 0.08% 0.01% 0 0 GigabitEthernet0/0/3 down down 0% 0% 0 0 GigabitEthernet0/0/4 down down 0% 0% 0 0 GigabitEthernet0/0/5 down down 0% 0% 0 0 GigabitEthernet0/0/6 down down 0% 0% 0 0 GigabitEthernet0/0/7 down down 0% 0% 0 0 GigabitEthernet0/0/8 down down 0% 0% 0 0
如果某接口的出方向和入方向流量相差不大,网络中存在环路的可能性很高。此时,需要检查对应接口的详细统计信息。
b、在交换机上执行命令display interface interface-type interface-num,进一步查看对应接口的详细统计信息,观察组播、广播报文增长速率。可以多执行几次,观察报文统计计数增长的情况。
[LSW] display interface GigabitEthernet 0/0/2 GigabitEthernet0/0/2 current state : UP Line protocol current state : UP Description:HUAWEI, AC Series, GigabitEthernet0/0/2 Interface Switch Port, PVID : 1, TPID : 8100(Hex), The Maximum Frame Length is 9216 IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 1051-7212-eac5 Last physical up time : 2016-04-18 23:57:03 UTC+08:00 Last physical down time : 2016-04-18 23:56:52 UTC+08:00 Current system time: 2016-04-19 00:11:04+08:00 Port Mode: COMMON COPPER Speed : 1000, Loopback: NONE Duplex: FULL, Negotiation: ENABLE Mdi : AUTO Last 300 seconds input rate 360 bits/sec, 0 packets/sec Last 300 seconds output rate 496 bits/sec, 0 packets/sec Input peak rate 470664 bits/sec,Record time: 2016-04-18 23:57:58 Output peak rate 174664 bits/sec,Record time: 2016-04-18 23:57:58 Input: 547 packets, 39311 bytes Unicast: 491, Multicast: 19 Broadcast: 37, Jumbo: 0 Discard: 0, Total Error: 0 CRC: 0, Giants: 0 Jabbers: 0, Throttles: 0 Runts: 0 Output: 600 packets, 49436 bytes Unicast: 599, Multicast: 0 Broadcast: 1, Jumbo: 0 Discard: 0, Total Error: 0 Collisions: 0, ExcessiveCollisions: 0 Deferreds: 0 Input bandwidth utilization threshold : 100.00% Output bandwidth utilization threshold: 100.00% Input bandwidth utilization : 0.01% Output bandwidth utilization : 0.01%
如果组播或广播报文的增长速率超过500pps,说明网络中可能存在环路。此时,需要检查网线连接和对应接口的配置,排除环路。
15、检查AP的IP地址是否冲突
一个AP与其他AP产生IP地址冲突,会导致SSID不稳定,用户频繁掉线。
# 通过display ap all查看所有AP的IP地址,检查其是否有IP冲突情况。
display ap all Total AP information: nor : normal [2] ----------------------------------------------------------------------------------------- ID MAC Name Group IP Type State STA Uptime ----------------------------------------------------------------------------------------- 0 dcd2-fcf6-76a0 area_1 ap-group1 192.168.120.254 AP6010DN-AGN nor 0 4H:49M:11S 1 60de-4474-9640 area_2 ap-group1 192.168.120.253 AP5010DN-AGN nor 0 6H:3M:40S ----------------------------------------------------------------------------------------- Total: 2
16、检查有线网络中中间设备的CPU利用率是否正常
如果设备的CPU利用率一直很高(超过80%),会导致各种业务异常,出现丢包、网络延迟大等现象。
# 在交换机上执行命令display cpu-usage,检查中间设备的CPU利用率是否正常。
display cpu-usage CPU Usage Stat. Cycle: 10 (Second) CPU Usage: 1.7% Max: 56.2% CPU Usage Stat. Time : 2016-04-19 00:16:59 CPU Usage Max. Time : 2016-04-18 23:57:14
造成设备CPU利用率高的原因有很多,当设备的CPU利用率一直很高时,请参考交换机维护宝典中CPU高的相关处理步骤。
17、检查网线是否有问题
如果中间有线网络中的网线有问题,会导致出现大量丢包、网络延迟大等现象。
# 进入接口视图,执行命令virtual-cable-test,最后四个状态均为OK表示网线好的,否则建议更换网线。
[2028-3e97-4240-GigabitEthernet0/0/0]virtual-cable-test Warning: The command will stop service for a while. Continue? [Y/N]y Info: This operation may take a few seconds. Please wait for a moment..done. Pair A length: 1 meter(s) Pair B length: 1 meter(s) Pair C length: 1 meter(s) Pair D length: 1 meter(s) Pair A state: OK Pair B state: OK Pair C state: OK Pair D state: OK -
18、收集故障信息
- 分别在AC和AP上执行命令display version,查看AC和AP的软件版本。
- 收集各检查步骤的显示信息。
本文由 @释然 发布于弱电智能网 。
题图来自Unsplash,基于CC0协议
内容观点仅代表作者本人,弱电智能网平台仅提供信息存储空间服务。
如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
文章名称:《华为无线AP终端网络慢什么原因怎么处理?》
文章链接:https://www.ruodian360.com/tech/networking/33577.html
添加微信ydian188免费入群,记得备注“弱电智能网”。