数通产品S5700交换机端口绑定出现业务中断

发布时间:  2017-01-03 浏览次数:  206 下载次数:  0
问题描述

现场工程师反馈在昨天上午业务突然反应过慢,严重时直接导致业务中断


网络描述:
核心交换机为两台S5700交换机做的堆叠,汇聚交换机也是两台交换机做的堆叠,核心与汇聚之间是两条链路做的捆绑,汇聚下面接的接入层交换机

网络拓扑图:

告警信息

通过抓包发现有很多FIB的数据包,如下:


处理过程
处理过程如下:
1、通过查看CPU利用率,发现CPU利用率也不高,在37%。
2、进行快ping时数据延时偶尔抖动,
3、然后通过断开期中一条链路进行快Ping,延时稳定,
4、然后再断开另一条链路,开启刚才断开的链路再进行快ping延时增大
5、通过查看上午抓的数据包进行分析、在抓的数据包中有一些错误数据包。(如上图所示)
6、通过查看接口信息时,发现一条链路入方向的inerror计数器特别大。
7、通过将有inerror告警的链路更换新的备用链路,进行测试观察,无此问题。
根因

此问题属于客户业务访问量增大,其中一条链路传输不稳定,存在误码,导致核心交换机端口拥塞,进行数据包丢弃,业务中断。

解决方案

更换新的备用链路

建议与总结

有时候业务中断并不是配置、设备方面的原因,也可以从链路层面找一下,处理问题一定要有自己一个思路,

END