S5700万兆口单通故障

发布时间:  2014-09-12 浏览次数:  659 下载次数:  0
问题描述
S5700-28C-EI-24S
有三条千兆业务链路接入到S5700_A,S5700_A和S5700_B分别使用两个万兆口做链路捆绑互联。

故障现象为:两条XG线路中的一条发生故障,形成单通现象。但是,当一条链路自动断掉后,之前的三条1G业务链路中有两条的业务也断了,只有一条正常运行,当用户手动关闭掉那条故障XG线路后,三条1G业务都恢复正常。
告警信息
故障链路两端的S5700上的XG接口状态不一致,S5700_A为UP,而S5700_B为DOWN,形成典型单通现象。
接口下有很多CRC错包,并且在不断上升。
处理过程
经用户排查,确实为线路故障,更换线路后,业务恢复正常。
由于S5700万兆接口无自协商功能,所以告知用户在两端启用DLDP功能。
两端配置如下

S5700_A
#
dldp enable
dldp interval 10
dldp delaydown-timer 2
#
#
interface XGigabitEthernet0/0/1
dldp enable
#
<S5700_A>dis dldp
DLDP global status: enable
DLDP interval: 10s
DLDP work-mode: enhance
DLDP authentication-mode: none
DLDP unidirectional-shutdown: auto
DLDP delaydown-timer: 2s
The number of enabled ports is: 1.
The number of global neighbors is: 1.

Interface XGigabitEthernet0/0/1
DLDP port state: advertisement
DLDP link state: up
The neighbor number of the port is: 1.
   Neighbor mac address:0819-a6b3-949d
   Neighbor port index:24
   Neighbor state:two way
   Neighbor aged time:25

<S5700_A>
<S5700_A>dis int br
……
GigabitEthernet0/0/24              down  down        0%     0%          0          0
XGigabitEthernet0/0/1        up    up       0.01%  0.01%          0          0
XGigabitEthernet0/0/2        down  down        0%     0%          0          0
……
<S5700_A>


S5700_B
#
dldp enable
dldp interval 10
dldp delaydown-timer 2
#
#
interface XGigabitEthernet0/0/1           
dldp enable
#
<V1R5>dis dldp
DLDP global status: enable
DLDP interval: 10s
DLDP work-mode: enhance
DLDP authentication-mode: none
DLDP unidirectional-shutdown: auto
DLDP delaydown-timer: 2s
The number of enabled ports is: 1.
The number of global neighbors is: 1.

Interface XGigabitEthernet0/0/1
DLDP port state: advertisement
DLDP link state: up
The neighbor number of the port is: 1.
   Neighbor mac address:0819-a6b3-9494
   Neighbor port index:24
   Neighbor state:two way
   Neighbor aged time:22

<V1R5>dis int br
……
GigabitEthernet0/0/24              down  down        0%     0%          0          0
XGigabitEthernet0/0/1        up    up       0.01%  0.01%          0          0
XGigabitEthernet0/0/2        down  down        0%     0%          0          0
……
<V1R5>



测试故障发生时DLDP的状态(切断S5700_A交换机上的一芯光纤)
S5700_A
<S5700_A>dis dldp
DLDP global status: enable
DLDP interval: 10s
DLDP work-mode: enhance
DLDP authentication-mode: none
DLDP unidirectional-shutdown: auto
DLDP delaydown-timer: 2s
The number of enabled ports is: 1.
The number of global neighbors is: 0.

Interface XGigabitEthernet0/0/1
DLDP port state: inactive
DLDP link state: down

The neighbor number of the port is: 0.
<S5700_A>
<S5700_A>
<S5700_A>dis int br
……
GigabitEthernet0/0/24              down  down        0%     0%          0          0
XGigabitEthernet0/0/1        down  down        0%     0%          0          0
XGigabitEthernet0/0/2        down  down        0%     0%          0          0
……
<S5700_A>


S5700_B

<V1R5>
Jan  1 2008 01:10:38 V1R5 DLDP/4/DETECTUNIDIRECT(t):OID: 1.3.6.1.4.1.2011.5.25.173.3.1 The port is detected in one way status. (IfIndex=29, IfName=XGigabitEthernet0/0/1)
<V1R5>
<V1R5>
<V1R5>dis dl
<V1R5>dis dldp
DLDP global status: enable
DLDP interval: 10s
DLDP work-mode: enhance
DLDP authentication-mode: none
DLDP unidirectional-shutdown: auto
DLDP delaydown-timer: 2s
The number of enabled ports is: 1.
The number of global neighbors is: 0.

Interface XGigabitEthernet0/0/1
DLDP port state: disable
DLDP link state: up

The neighbor number of the port is: 0.
<V1R5>
<V1R5>
<V1R5>
<V1R5>
<V1R5>dis int br
……
GigabitEthernet0/0/24              down  down        0%     0%          0          0
XGigabitEthernet0/0/1        up    up       0.01%  0.01%          0          0
XGigabitEthernet0/0/2        down  down        0%     0%          0          0
……
<V1R5>

A的DLDP状态为
DLDP port state: inactive
DLDP link state: down
B的DLDP状态为
DLDP port state: disable
DLDP link state: up
测试成功,该故障接口被DLDP给disable掉了。
根因
这里使用的是双芯光纤,形成单通现象很可能是因为其中一芯中断通信,而另一根正常通信而造成的。
在开启两端自协商的情况下,如果发生这种情况应该是会被自协商直接将两端都DOWN掉的,但是经研发确认,S5700的万兆接口不支持自协商,是默认强制为万兆的,所以在这里,自协商无法派上用场。所以导致接口出现单通现象,而交换机没有做出任何处理动作。
在链路捆绑方面,因为是根据HASH算法实现的链路负载负担,所以最初得出的使三条业务中的两条经过当前故障链路到达S5700_B。但是此时S5700_A的接口是UP的,所以两条业务仍然会继续走故障线路,数据有去无回,从而导致两条业务的中断。
建议与总结
1、目前S5700的万兆接口不支持自协商;
2、当DLDP阻塞接口时,接口的物理状态仍然会是UP的,但是在DLDP的DLDP port state中为disable,因为接口是被DLDP协议所阻塞的。

END