流量丢包如何定位解决?

2021-05-17 15:53:42 浏览数 (1)

后台回复“网络工程师”获取计算机网络资料

1 故障现象

丢包率是衡量网络质量的指标之一,可是我们在网络中经常会遇到数据丢包的问题,平时生活中我们看视频发现有卡顿画面不清晰的是否很大一部分原因是丢包了,那么如何解决网络丢包问题呢?

2 常见故障原因

  • 物理层原因——端口down、端口流量超过接口带宽、传输介质问题;
  • 数据链路层原因——STP环路、广播风暴、vlan透传配置问题等;
  • 网络层原因——路由配置问题、路由震荡等;

3 故障处理方式

可以参考以下步骤进行定位(请保存操作记录):

步骤1: 检查物理链路问题;

检查物理连线是否存在松动、接触不良、线缆故障等现象。

执行命令display interface ,查看字段Last physical up timeLast physical down time,通过端口up/down的时间,来判断端口是否存在闪断现象。

代码语言:javascript复制
<HUAWEI> display interface 10ge 1/0/1
10GE1/0/1 current state : UP (ifindex: 12)                                      
Line protocol current state : UP                                                
Description:                                                                    
Route Port,The Maximum Transmit Unit is 1500,The Maximum Frame Length is 9216   
Internet protocol processing : disabled                                         
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 0019-7459-3301 
Port Mode:             AUTO,     Port Split/Aggregate:         DISABLE
Speed:                 AUTO,     Loopback:                        NONE
Duplex:                FULL,     Negotiation:                        -
Input Flow-control: DISABLE,     Output Flow-control:          DISABLE
Mdi:                      -,     Fec:                                -
Last physical up time   : 2013-10-29 10:01:46                                   
Last physical down time : 2013-10-29 10:00:53                                   
Current system time: 2013-10-29 10:03:38

如果物理链路状态异常,请更换物理链路线缆。

步骤2:检查流量是否超过接口带宽;

执行命令display interface brief | include up,查看端口进来的流量和出去的流量是否达到100%来判断是否超带宽。

如果流量超宽,请增加负载分担链路或者增大接口速率转发流量。

步骤3:检查是否存在STP导致接口阻塞;

通过执行命令行display stp brief,查看接口是否阻塞。如果转发接口STP状态是discardinglearning,请检查网络中是否存在环路。

步骤4:检查是否存在环路导致广播风暴;

检查MAC漂移记录,注意move-ports通常是环路上端口或者指向环的端口。

代码语言:javascript复制
<HUAWEI> display mac-address flapping
Mac-address Flapping Configurations :
-------------------------------------------------------------------------------
  Flapping detection          : Enable
  Aging  time(s)              : 300
  Quit-vlan Recover time(m)   : --
  Exclude vlan-list           : --
-------------------------------------------------------------------------------
S  : start time    E  : end time    (D) : error down
-------------------------------------------------------------------------------
Time                  VLAN MAC-Address    Original-Port  Move-Ports     MoveNum
-------------------------------------------------------------------------------
S:2014-05-26 15:06:13 1    0000-c10b-0102 10GE4/0/20     10GE4/0/1      47598  
E:2014-05-26 15:15:45                                    10GE4/0/0      

-------------------------------------------------------------------------------
Total items on slot 3: 1

-------------------------------------------------------------------------------
Time                  VLAN MAC-Address    Original-Port  Move-Ports     MoveNum
-------------------------------------------------------------------------------
S:2014-05-26 15:06:13 1    0000-c10b-0102 10GE4/0/20     10GE4/0/1      65535  
E:2014-05-26 15:15:46                                    10GE4/0/0      

-------------------------------------------------------------------------------
Total items on slot 4: 1

说明:当有如上回显时,表示存在MAC漂移。如果存在MAC漂移,请查找MAC漂移的根源并解决。

步骤5:检查路由信息是否正确;

1、执行命令display ip routing-table statisticsdisplay ip routing-table all-vpn-instance statistics,查看字段Summary Prefixes,计算两者统计之和是否超规格。

如果超出规格,请更换高规格单板。

2、执行命令display ip routing-table [ vpn-instance vpn-instance-name ] ip-address [ mask | mask-length ],查看路由表中的下一跳和出端口信息是否正确。

诊断视图下执行命令display fei ipv4 route-entry slot slot-id dst-ip ip-address查看下发的路由前缀信息是否正确,如果不正确,请检查配置是否存在问题。

步骤6:检查ARP信息是否正确;

执行命令display arp | include ip-address,查看ARP是否学到。

如果ARP没有学习到,一般有以下可能性:

1、执行命令display arp statistics,查看ARP数量是否超规格。

<HUAWEI> display arp statistics

Dynamic: 207 (Resolved : 207 Incomplete: 0) Static: 1 OpenFlow: 0

如果ARP数量超出规格,请更换高规格单板(在CE12800&12800E系列交换机中可以切换ARP模式)。

2、执行命令display cpu-defend statisticspacket-type arp slotslot-id,查看是否有大量ARP报文被丢弃,来判断是否存在ARP攻击。

<HUAWEI> display cpu-defend statistics packet-type arp slot 1/1

Statistics(packets) on slot 1/1 :

代码语言:javascript复制
--------------------------------------------------------------------------------                                                    
PacketType               Total Passed        Total Dropped   Last Dropping Time                                                     
                    Last 5 Min Passed   Last 5 Min Dropped                                                                          
--------------------------------------------------------------------------------                                                    
arp                            132775                 6117   2015-12-09 21:05                                                       
                                  169                    0                                                                          
--------------------------------------------------------------------------------

如果存在ARP攻击,可以攻击溯源查找,采取惩罚措施。

4 总结

如何解决丢包的问题呢? 第一种是物理层的问题,可能是接口链路的问题,流量是否超过接口带宽; 第二种是数据链路层的问题,确认是否存在二层环路导致广播风暴; 第三种网络层的问题,确认是否存在路由配置问题,是否存在ARP表项错误; 在处理流量丢包时,大家可以按照这个思路解决问题。

0 人点赞