【网工常见故障处理系列】手把手教你处理接口down问题

2021-05-17 15:53:10 浏览数 (1)

后台回复“网络工程师”获取计算机网络资料

1 故障现象

作为网络工程师,经常遇到网络设备端口down的问题,今天就带大家一起梳理下接口down的原因以及常见的处理思路。

2 常见故障原因

  • 接口Error-Down;(一般是华为的CE交换机有error-down)
  • 传输介质、光模块硬件问题;
  • 接口配置问题;

3 故障处理方式

出现接口不Up现象时,可以参考以下步骤进行定位(请保存操作记录):

步骤1: 查看接口是否被Error-Down;

代码语言:javascript复制
<HUAWEI> display interface 10ge 1/0/1                                          
10GE1/0/1 current state : ERROR DOWN(link-flap) (ifindex: 5)                        
Line protocol current state : DOWN 
……
  • 如果接口状态是Error-Down,可以通过通过查看Error-Down原因进行定位修复,例如在本例中,接口10GE1/0/1的Error-Down原因为link-flap,即设备检测到10GE1/0/1接口频繁振荡后, 关闭了该接口并将其状态置为ERROR DOWN(link-flap) 。
  • 由于Error-Down原因较多,本章内容不做过多叙述。

步骤2 :查看光模块信息是否有问题;

代码语言:javascript复制
<HUAWEI> display interface 10ge 1/0/3 transceiver verbose 
                                                                                
 10GE1/0/3 transceiver information:                                            
-------------------------------------------------------------------             
 Common information:                                                            
   Transceiver Type                    :10GBASE_SR                            
   Connector Type                        :LC                                    
   Wavelength (nm)                       :850                                   
   Transfer Distance (m)              :30(62.5um/125um OM1)                  
                                          80(50um/125um OM2)                    
                                          300(50um/125um OM3)                   
                                          400(50um/125um OM4)                   
……
-------------------------------------------------------------------             
 Alarm information:                                                             
    LOS Alarm                                                                   
-------------------------------------------------------------------             
 Diagnostic information:                                                        
   Temperature (Celsius)                 :34.68                                 
   Voltage (V)                           :3.36                                  
   Bias Current (mA)                     :7.03                                  
   Bias High Threshold (mA)              :10.00                                 
   Bias Low Threshold (mA)               :2.60                                  
   Current RX Power (dBm)                :-50.00                                
   Default RX Power High Threshold (dBm) :1.50                                  
   Default RX Power Low Threshold (dBm)  :-14.00                                
   Current TX Power (dBm)                :-2.22                                 
   Default TX Power High Threshold (dBm) :-1.00                                 
   Default TX Power Low Threshold (dBm)  :-8.00                                 
-------------------------------------------------------------------

根据上述回显,分别检查以下几项内容:

  • 根据Transceiver Type项查看光模块类型和对端是否匹配。比如对端使用GE光模块,本端使用10GE光模块,那么接口不会Up,用户可以根据实际情况更换本端或者对端的光模块,使两端的光模块速率一致。
  • 根据Transfer Distance项查看光模块的传输距离,根据当前所用光纤类型,判断其长度是否在光模块支持的传输距离范围内。上述回显中,OM1类型光纤支持传输距离为30米,如果实际传输距离超过30米,则需要更换更高级别的光纤。
  • 根据Diagnostic information信息中的Current TX PowerCurrent RX Power查看接口的收发光功率是否正常。 如:Current RX Power值是否在Default RX Power High Threshold (dBm)Default RX Power Low Threshold (dBm)的值之间。若在两个值之间则正确,反之,则需要检查对端光模块是否正常或者有无正确连接光纤。同样的,如果Current TX Power超出范围,表示发送光功率异常,需要检查本端光模块是否正常或者光纤连接是否正确。
  • 根据Alarm information项判断光模块是否华为以太网交换机认证的光模块。如果显示“Non-Huawei-Certified Transceiver”或“Non-Huawei-Ethernet-Switch-Certified Transceiver”的告警信息,则表示当前使用的光模块为非华为以太网交换机认证光模块,需要更换为华为以太网交换机认证光模块。

步骤3 :查看链路两端接口的配置是否一致。

代码语言:javascript复制
<HUAWEI> system-view
[~HUAWEI] interface 10ge 1/0/1
[~HUAWEI-10GE1/0/1] display this
#                                                                                                                                   
interface 10GE1/0/1                                                                                                                   
 device transceiver 1000BASE-X                                                                                                      
 negotiation disable                                                                                                                
#                                                                                                                                   
Return
代码语言:javascript复制
代码语言:javascript复制
[~HUAWEI-10GE1/0/1] display this interface
10GE1/0/1 current state : DOWN (ifindex: 3109)                                  
Line protocol current state : DOWN                                              
Description:                                                                    
Switch Port, PVID :    1, TPID : 8100(Hex), The Maximum Frame Length is 9216    
Internet protocol processing : disabled                                         
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 0019-7459-3301 
Port Mode:    COMMON COPPER,     Port Split/Aggregate:         DISABLE 
Speed:                 AUTO,     Loopback:                        NONE          
Duplex:                FULL,     Negotiation:                  DISABLE          
Input Flow-control: DISABLE,     Output Flow-control:          DISABLE          
……
  • 根据display this回显内容,判断当前接口下的配置和对端是否一致,例如是否有shutdowntraining等配置。
  • 根据display this interface回显内容,查看NegotiationSpeedDuplex项,判断接口自协商、速度、双工是否匹配。

如果上述配置不一致,用户需要修改接口的配置使两端接口的自协商模式、速率、双工等参数一致。

4 总结

从本质上讲接口down的原因就是两种。 第一种就是硬件问题,要么是光模块问题、要么是传输介质问题、要么是设备端口、单板问题; 第二种就是软件问题,软件问题就是配置的问题,可能是端口未打开,接口两端配置不一致等; 在处理故障时,大家可以从这两方尝试解决问题。

0 人点赞