正文
一 故障描述
SwitchB上发生报文拥塞后,向SwitchA发送流量控制消息,但是SwitchB上的报文拥塞状况没有缓解,在SwitchB的入方向存在报文丢弃。
二 故障处理
1、在SwitchB上查看10GE1/0/1接口的统计计数,发现Input的Discard字段存在计数。
通常情况下,该字段存在计数,是由于SwitchA未响应SwitchB发送的流量控制消息停止发包而导致的。
<HUAWEI> display interface 10ge 1/0/1
代码语言:javascript复制10GE1/0/1 current state : UP (ifindex: 5)
Line protocol current state : UP
Description:
Switch Port, PVID : 1, TPID : 8100(Hex), The Maximum Frame Length is 9216
Internet protocol processing : disabled
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 206b-88f3-3f11
Port Mode: COMMON COPPER, Port Split: -
Speed: 1000, Loopback: NONE
Duplex: FULL, Negotiation: ENABLE
Input Flow-control: ENABLE, Output Flow-control: ENABLE
Mdi: AUTO
Last physical up time : 2018-11-05 14:42:43
Last physical down time : 2018-10-29 20:38:50
Current system time: 2018-11-05 15:16:45
Statistics last cleared:never
Last 10 seconds input rate: 999739730 bits/sec, 822154 packets/sec
Last 10 seconds output rate: 27157 bits/sec, 40 packets/sec
Input peak rate 1000000000 bits/sec, Record time: 2018-11-05 14:59:20
Output peak rate 27824 bits/sec, Record time: 2018-11-05 15:15:07
Input : 131971080264 bytes, 868231263 packets
Output: 651057 bytes, 6771 packets
Input:
Unicast: 868230190, Multicast: 53
Broadcast: 1020, Jumbo: 0
Discard: 79259545, Frames: 0
Pause: 0
Total Error: 0
CRC: 0, Giants: 0
Jabbers: 0, Fragments: 0
Runts: 0, DropEvents: 0
Alignments: 0, Symbols: 0
Ignoreds: 0
Output:
Unicast: 0, Multicast: 2111
Broadcast: 510, Jumbo: 0
Discard: 0, Buffers Purged: 0
Pause: 4150
Input bandwidth utilization threshold : 90.00%
Output bandwidth utilization threshold: 90.00%
Last 10 seconds input utility rate: 99.97%
Last 10 seconds output utility rate: 0.01%
代码语言:javascript复制
2、CloudEngine系列交换机向对端设备发送的流量控制消息有两种:Flow-control流控反压帧、PFC反压通知消息。
可以通过如下方法确认CloudEngine系列交换机具体发送的是哪种流量控制消息。
(1)Flow-control流控反压帧
在SwitchB上查看10GE1/0/1接口下的配置,若发现存在flow-control配置,且接口的统计计数中Output的Pause字段存在计数,则说明SwitchB上已出现报文拥塞,且SwitchB向SwitchA发送的是Flow-control流控反压帧,但SwitchA未对该Flow-control流控反压帧进行响应。
(2)PFC反压通知消息
在SwitchB上查看10GE1/0/1接口下的配置,若发现存在dcb pfc enable配置,且执行display dcb pfc命令查看PFC的反压帧计数信息存在计数,则说明SwitchB上已出现报文拥塞,且SwitchB向SwitchA发送的是PFC反压通知消息,但SwitchA未对该PFC反压通知消息进行响应。
代码语言:javascript复制<HUAWEI> display dcb pfc interface 10ge 1/0/1
-------------------------------------------------------------------------------
Interface Queue Received(Frames) Transmitted(Frames)
DeadlockNum RecoveryNum
-------------------------------------------------------------------------------
10GE1/0/1 3 0 685177
0 0
-------------------------------------------------------------------------------
代码语言:javascript复制
三 原因分析:
本端设备发生报文拥塞并向对端设备发送流量控制消息以通知对端设备停止发包。
对端设备收到流量控制消息后未对消息进行响应,仍然向本端设备发送报文,从而导致本端设备接口入方向存在报文丢弃。
四 解决方案:
开启对端设备的流量控制功能,确保其能正常响应本端设备发送出来的流量控制消息。
五 总结
合理规划网络流量转发路径,避免网络出现拥塞。
如果对你有用,帮忙点个在看 点赞 转发吧,如果有什么想法,请在评论区留言!