S7700交换机集群后,集群链路状态出现“UP 16G!”

发布时间:  2016-11-09 浏览次数:  98 下载次数:  1
问题描述
解决S7700交换机堆叠后集群卡面板口出现“UP 16G!”的问题
告警信息
集群卡Chassis 2面板口2/8/0/3下有错包
处理过程

定位出现该故障的可能原因
1.查看集群链路的连线信息以及状态信息,通过命令  display css channel
<d5000-sw1>display css channel
                Chassis 1               ||               Chassis 2             
================================================================================
Num [SRUA HG]    [VSTS Port(Status)]    ||    [VSTS Port(Status)]    [SRUA HG]
1   1/7  0/0  -- 1/7/0/1(UP 16G)     ---||--- 2/8/0/4(UP 16G)     -- 2/7  0/14
2   1/7  0/1  -- 1/7/0/3(UP 16G)     ---||--- 2/7/0/2(UP 16G)     -- 2/8  0/15
3   1/7  0/14 -- 1/8/0/4(UP 16G)     ---||--- 2/8/0/1(UP 16G)     -- 2/8  0/0
4   1/7  0/15 -- 1/8/0/2(UP 16G)     ---||--- 2/7/0/3(UP 16G)     -- 2/7  0/1
5   1/8  0/0  -- 1/8/0/1(UP 16G)     ---||--- 2/7/0/4(UP 16G)     -- 2/8  0/14
6   1/8  0/1  -- 1/8/0/3(UP 16G)     ---||--- 2/8/0/2(UP 16G)     -- 2/7  0/15
7   1/8  0/14 -- 1/7/0/4(UP 16G)     ---||--- 2/7/0/1(UP 16G)     -- 2/7  0/0
8   1/8  0/15 -- 1/7/0/2(UP 16G)     ---||--- 2/8/0/3(UP 16G!)    -- 2/8  0/1

Current system time: 2016-08-04 15:43:45:0170
CSS channel 1 last physical down time: 2016-08-04 14:53:30:0270
CSS channel 3 last physical down time: 2016-08-04 14:59:21:0080
CSS channel 4 last physical down time: 2016-08-04 15:00:34:0680
CSS channel 5 last physical down time: 2016-08-04 14:59:27:0210
CSS channel 6 last physical down time: 2016-08-04 14:59:22:0030
CSS channel 7 last physical down time: 2016-08-04 14:59:31:0140
CSS channel 8 last physical down time: 2016-08-04 14:59:31:0260

<d5000-sw1>dis css status
CSS Enable switch On

Chassis Id   CSS Enable   CSS Status      CSS Mode    Priority    Master Force
------------------------------------------------------------------------------
1            On           Standby         CSS card    10          Off        
2            On           Master          CSS card    100         Off        
<d5000-sw1>
<d5000-sw1>


发现集群状态正常,排除配置的错误。

2.查看告警信息,发现集群卡Chassis 2面板口2/8/0/3下有错包,由于接口下有错包所以初步判定是集群卡面板口的故障或者是高速线缆的故障。

3.将高速线缆拔下两端对调后,重启设备,检查状态发现2/8/0/3(UP 16G!)故障现象仍然存在,即初步排除了高速线缆的问题

4.将集群卡Chassis 2拔下(S7700设备集群卡不支持热插拔,固首先要将单板拔下或将设备下电后再将集群卡拔出,更换板卡时要佩戴防静电手环),更换一块新的集群卡
将设备加电后,查看状态

<d5000-sw1>display css channel
                Chassis 1               ||               Chassis 2             
================================================================================
Num [SRUA HG]    [VSTS Port(Status)]    ||    [VSTS Port(Status)]    [SRUA HG]
1   1/7  0/0  -- 1/7/0/1(UP 16G)     ---||--- 2/8/0/4(UP 16G)     -- 2/7  0/14
2   1/7  0/1  -- 1/7/0/3(UP 16G)     ---||--- 2/7/0/2(UP 16G)     -- 2/8  0/15
3   1/7  0/14 -- 1/8/0/4(UP 16G)     ---||--- 2/8/0/1(UP 16G)     -- 2/8  0/0
4   1/7  0/15 -- 1/8/0/2(UP 16G)     ---||--- 2/7/0/3(UP 16G)     -- 2/7  0/1
5   1/8  0/0  -- 1/8/0/1(UP 16G)     ---||--- 2/7/0/4(UP 16G)     -- 2/8  0/14
6   1/8  0/1  -- 1/8/0/3(UP 16G)     ---||--- 2/8/0/2(UP 16G)     -- 2/7  0/15
7   1/8  0/14 -- 1/7/0/4(UP 16G)     ---||--- 2/7/0/1(UP 16G)     -- 2/7  0/0
8   1/8  0/15 -- 1/7/0/2(UP 16G)     ---||--- 2/8/0/3(UP 16G)    -- 2/8  0/1

发现故障现象排除,反复检查设备状态后,确认故障现象排除。

根因
硬件集群卡端口出现故障
解决方案

 将集群卡Chassis 2拔下(S7700设备集群卡不支持热插拔,固首先要将单板拔下或将设备下电后再将集群卡拔出,更换板卡时要佩戴防静电手环),更换一块新的集群卡
将设备加电后,查看状态

<d5000-sw1>display css channel
                Chassis 1               ||               Chassis 2             
================================================================================
Num [SRUA HG]    [VSTS Port(Status)]    ||    [VSTS Port(Status)]    [SRUA HG]
1   1/7  0/0  -- 1/7/0/1(UP 16G)     ---||--- 2/8/0/4(UP 16G)     -- 2/7  0/14
2   1/7  0/1  -- 1/7/0/3(UP 16G)     ---||--- 2/7/0/2(UP 16G)     -- 2/8  0/15
3   1/7  0/14 -- 1/8/0/4(UP 16G)     ---||--- 2/8/0/1(UP 16G)     -- 2/8  0/0
4   1/7  0/15 -- 1/8/0/2(UP 16G)     ---||--- 2/7/0/3(UP 16G)     -- 2/7  0/1
5   1/8  0/0  -- 1/8/0/1(UP 16G)     ---||--- 2/7/0/4(UP 16G)     -- 2/8  0/14
6   1/8  0/1  -- 1/8/0/3(UP 16G)     ---||--- 2/8/0/2(UP 16G)     -- 2/7  0/15
7   1/8  0/14 -- 1/7/0/4(UP 16G)     ---||--- 2/7/0/1(UP 16G)     -- 2/7  0/0
8   1/8  0/15 -- 1/7/0/2(UP 16G)     ---||--- 2/8/0/3(UP 16G)    -- 2/8  0/1

发现故障现象排除,反复检查设备状态后,确认故障现象排除。

建议与总结
板卡或者光模块在不使用时要用防静电口袋装好防止外界因素影响硬件,如:灰尘进入等

END