后台回复“网络工程师”获取计算机网络资料
1 故障现象
作为网络工程师,经常遇到网络设备端口down的问题,今天就带大家一起梳理下接口down的原因以及常见的处理思路。
2 常见故障原因
- 接口Error-Down;(一般是华为的CE交换机有error-down)
- 传输介质、光模块硬件问题;
- 接口配置问题;
3 故障处理方式
出现接口不Up现象时,可以参考以下步骤进行定位(请保存操作记录):
步骤1: 查看接口是否被Error-Down;
代码语言:javascript复制<HUAWEI> display interface 10ge 1/0/1
10GE1/0/1 current state : ERROR DOWN(link-flap) (ifindex: 5)
Line protocol current state : DOWN
……
- 如果接口状态是Error-Down,可以通过通过查看Error-Down原因进行定位修复,例如在本例中,接口10GE1/0/1的Error-Down原因为link-flap,即设备检测到10GE1/0/1接口频繁振荡后, 关闭了该接口并将其状态置为ERROR DOWN(link-flap) 。
- 由于Error-Down原因较多,本章内容不做过多叙述。
步骤2 :查看光模块信息是否有问题;
代码语言:javascript复制<HUAWEI> display interface 10ge 1/0/3 transceiver verbose
10GE1/0/3 transceiver information:
-------------------------------------------------------------------
Common information:
Transceiver Type :10GBASE_SR
Connector Type :LC
Wavelength (nm) :850
Transfer Distance (m) :30(62.5um/125um OM1)
80(50um/125um OM2)
300(50um/125um OM3)
400(50um/125um OM4)
……
-------------------------------------------------------------------
Alarm information:
LOS Alarm
-------------------------------------------------------------------
Diagnostic information:
Temperature (Celsius) :34.68
Voltage (V) :3.36
Bias Current (mA) :7.03
Bias High Threshold (mA) :10.00
Bias Low Threshold (mA) :2.60
Current RX Power (dBm) :-50.00
Default RX Power High Threshold (dBm) :1.50
Default RX Power Low Threshold (dBm) :-14.00
Current TX Power (dBm) :-2.22
Default TX Power High Threshold (dBm) :-1.00
Default TX Power Low Threshold (dBm) :-8.00
-------------------------------------------------------------------
根据上述回显,分别检查以下几项内容:
- 根据Transceiver Type项查看光模块类型和对端是否匹配。比如对端使用GE光模块,本端使用10GE光模块,那么接口不会Up,用户可以根据实际情况更换本端或者对端的光模块,使两端的光模块速率一致。
- 根据Transfer Distance项查看光模块的传输距离,根据当前所用光纤类型,判断其长度是否在光模块支持的传输距离范围内。上述回显中,OM1类型光纤支持传输距离为30米,如果实际传输距离超过30米,则需要更换更高级别的光纤。
- 根据Diagnostic information信息中的Current TX Power和Current RX Power查看接口的收发光功率是否正常。 如:Current RX Power值是否在Default RX Power High Threshold (dBm)和Default RX Power Low Threshold (dBm)的值之间。若在两个值之间则正确,反之,则需要检查对端光模块是否正常或者有无正确连接光纤。同样的,如果Current TX Power超出范围,表示发送光功率异常,需要检查本端光模块是否正常或者光纤连接是否正确。
- 根据Alarm information项判断光模块是否华为以太网交换机认证的光模块。如果显示“Non-Huawei-Certified Transceiver”或“Non-Huawei-Ethernet-Switch-Certified Transceiver”的告警信息,则表示当前使用的光模块为非华为以太网交换机认证光模块,需要更换为华为以太网交换机认证光模块。
步骤3 :查看链路两端接口的配置是否一致。
代码语言:javascript复制<HUAWEI> system-view
[~HUAWEI] interface 10ge 1/0/1
[~HUAWEI-10GE1/0/1] display this
#
interface 10GE1/0/1
device transceiver 1000BASE-X
negotiation disable
#
Return
代码语言:javascript复制
代码语言:javascript复制[~HUAWEI-10GE1/0/1] display this interface
10GE1/0/1 current state : DOWN (ifindex: 3109)
Line protocol current state : DOWN
Description:
Switch Port, PVID : 1, TPID : 8100(Hex), The Maximum Frame Length is 9216
Internet protocol processing : disabled
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 0019-7459-3301
Port Mode: COMMON COPPER, Port Split/Aggregate: DISABLE
Speed: AUTO, Loopback: NONE
Duplex: FULL, Negotiation: DISABLE
Input Flow-control: DISABLE, Output Flow-control: DISABLE
……
- 根据display this回显内容,判断当前接口下的配置和对端是否一致,例如是否有shutdown、training等配置。
- 根据display this interface回显内容,查看Negotiation、Speed、Duplex项,判断接口自协商、速度、双工是否匹配。
如果上述配置不一致,用户需要修改接口的配置使两端接口的自协商模式、速率、双工等参数一致。
4 总结
从本质上讲接口down的原因就是两种。 第一种就是硬件问题,要么是光模块问题、要么是传输介质问题、要么是设备端口、单板问题; 第二种就是软件问题,软件问题就是配置的问题,可能是端口未打开,接口两端配置不一致等; 在处理故障时,大家可以从这两方尝试解决问题。