XX学校S12700交换机由于堆叠问题导致设备板卡端口异常UP/Down问题

发布时间:  2015-04-07 浏览次数:  274 下载次数:  7
问题描述

组网拓扑如下:

两台S12708设备通过交换板插堆叠卡堆叠,并通过业务口互联一根网线进行双主检测,S5700交换机通过两根万兆光纤双归连接至核心S12708做捆绑

故障现象如下:

1)部分万兆业务板上的端口不停up/down,且端口下错包不停增长

2)部分万兆业务板上的端口down掉之后起不来,除非重启设备或重新插拔模块

告警信息

(1)   端口下错包不停增长

 

2Log信息中部分端口不停up/down                         


处理过程

1)因接口下错包不停增长,因此怀疑是光纤链路出现问题,更换光纤后,问题仍复现

2)问题复现后,通过检测模块发光功率,发现两端模块部分光损较低的模块,接口可正常up,怀疑是模块的问题,对模块进行更换,更换后接口正常但第二天故障仍复现。

3)后通过重启S5700交换机,发现原本正常的端口重启后随机出现Down的情况,拔掉所有除聚合线路(包括双主检测线)进行测试,发现无接口down的情况但是出现间歇性业务不通的情况,且端口act灯不闪,怀疑是堆叠问题,后重新进行堆叠后端口正常。

根因

S12700由于设备堆叠问题,间歇性的出现堆叠分裂导致接口不正常,后更换堆叠卡槽位重新堆叠后,接口正常

解决方案

(1)将有问题的端口,使用命令自环下看端口是否正常UP,如端口正常UP则进行第2步

(2)对相应端口尾纤以及中间链路进行更换,更换后观察端口是否有相应问题复现,如有则执行第3步

(3)对问题端口的模块与正常端口的模块进行交换,观察接口状态,如仍有现象复现,则执行第4步

(4)拔掉双主检测网线,多次重启下接设备,看是否有端口非正常状态(随机出现),如有则执行第5步

(5)更换堆叠卡槽位后进行堆叠,主备状态正常后,观察是否有现象复现,如有执行第6步

(6)协调进行硬件更换。


建议与总结

 堆叠完成并且状态稳定后,多次倒换设备主备,观察堆叠状态。 

END