某局点S9306交换机堆叠设备转发不通问题

发布时间:  2016-12-23 浏览次数:  92 下载次数:  0
问题描述

1. 问题描述

1.1 问题涉及的设备及版本

S9306 V100R006C00SPC800 

1.2 网络拓朴

两台S9306设备做堆叠,SwitchA为1 框,SwitchB为2框,Gi1/1/0/9和Gi2/2/0/6分别连接网络中的其他设备


1.3 现网问题描述

PING请求报文经Gi1/1/0/9进入堆叠设备,从Gi2/2/0/6出去到达目的设备,目的设备的应答报文从Gi2/20/6进入堆叠设备后,在Gi1/1/0/9没有出去,导致三层转发不通。

告警信息

处理过程

1. 处理过程

116

(1) 出现转发不通时,现场发现堆叠线缆故障导致堆叠口2/8 port 3、2/7 port 2、1/8 port 3、1/8 port 2 down掉,将两根故障堆叠线缆拔出后,仍然转发不通。

(2) 分别在堆叠设备的两个端口Gi1/1/0/9和Gi2/2/0/6做inbound和outbound方向流统计,其中Gi2/2/0/6 inbound和outbound方向统计正常,端口Gi1/1/0/9 inbound方向统计正常,而outbound方向统计值无变化。

(3) 检查1框1槽接口板和2框2槽接口板的转发表项,转发表项下发正常。

(4) 将出现堆叠口down的线缆重新插拔测试,堆叠口2/8 port 3和1/8 port 2 up,堆叠口2/7 port 2和1/8 port 3仍然down,说明出现问题时只有一根堆叠线故障,另一根是由于堆叠线是由于没有插紧导致堆叠口down。在只有一根堆叠线故障时,转发恢复正常。

(5) 做插拔堆叠线缆测试,只要拔掉2/8 port 3后转发就不通。

117日~120

根据反馈信息进行环境复现,在拔掉两根堆叠线后能够复现转发不通的现象,S9306堆叠环境只支持一条链路故障。

根因

由于S9300堆叠只支持一条链路故障,所以在两根堆叠线故障后会出现转发不通。下面对客户提出的出现链路故障或一个主控板故障时发生的情况分别给予解释。

1. 对于堆叠链路出现故障的情况

    堆叠线缆故障只支持一条链路故障,故障时有告警发出,如下,根据告警信息检查是对应的堆叠线缆没有插紧还是堆叠线缆本身问题。

Jan 13 2016 20:55:41 dyga-css CSSM/4/STACKLINKDOWN:OID 1.3.6.1.4.1.2015.5.25.183.3.3.2.1 1/8 CSS port 2 down.

Jan 13 2016 20:55:41 dyga-css CSSM/4/STACKLINKDOWN:OID 1.3.6.1.4.1.2015.5.25.183.3.3.2.1 2/8 CSS port 3 down.

 

出现一条链路故障时减少12.5%的带宽。

 

2. 对于主控板出现故障的情况  

当一个主控板故障时,比如插拔或复位一个主控板时会导致主备倒换。举例说明:SwitchA和SwitchB组成堆叠系统,如图示:


在堆叠系统建立后,堆叠设备中各主控板角色如下:

SwitchA——堆叠主交换机;

SwitchB——堆叠备份交换机;

SwitchA SLOT7——堆叠系统主控板;

SwitchB SLOT7——堆叠系统备用主控板;

SwitchA SLOT8——堆叠系统的候选系统备用主控板;

SwitchB SLOT8——堆叠系统的候选系统备用主控板;

 

(1) 如果SwitchA主用主控板SLOT 7出现故障复位,则堆叠设备中各主控板角色变化如下:

SwitchA——堆叠备份交换机;

SwitchB——堆叠主交换机;

SwitchA SLOT7——故障复位;

SwitchB SLOT7——堆叠系统主控板;

SwitchA SLOT8——堆叠系统备用主控板;

SwitchB SLOT8——堆叠系统的候选系统备用主控板。

 

(2) 如果SwitchB主用主控板SLOT 7出现故障复位,则堆叠设备中各主控板角色变化如下:

SwitchA——堆叠主交换机;

SwitchB——堆叠备份交换机;

SwitchA SLOT7——堆叠系统主控板;

SwitchB SLOT7——故障复位;

SwitchA SLOT8——堆叠系统的候选系统备用主控板;

SwitchB SLOT8——堆叠系统备用主控板。

(3) 如果SwitchA或SwitchB的备用主控板出现故障复位,则堆叠主交换机和堆叠备份交换机的角色不会发生变化。

上述三种情况出现时都会减少一半带宽并无其他影响。

解决方案

更换出现故障的堆叠线缆。

END