CE12800堆叠后视频业务出现卡顿

发布时间:  2016-01-16 浏览次数:  279 下载次数:  0
问题描述

 

两台CE12800进行堆叠,承载的视频媒体业务。在晚高峰期间出现用户点播视频出现卡顿现象,几分钟后故障现象消失。

告警信息
处理过程

由于是大面积用户出现故障,所以初步判断CE12800出现问题的可能性较大。首先重点对两台CE12800进行排查。通过收集设备诊断信息,发现部分端口流量几乎达到满流量,有很多端口出现丢包现象。进行一步分析发现端口流量较大的都是上下行的接口,还有堆叠之间的心跳线接口。由于当初为了让流量下行到用户更为均匀,所以关闭了本地流量优先转发的功能。这样让流量进行跨框转发。在仔细分析后发现堆叠之间心跳接口采用的是40GE接口,接口利用率大概在30%-40%之间。接口利用率虽然在正常范围内,但是依然存在丢包计数,并且丢包计数比较大。后来故障再一次复现,我们重点观察了40GE接口,发现丢包数量大量增加。基本可以断定故障是因为堆叠心跳接口之间丢包引起的。

根因

两台CE12800堆叠心跳接口采用的是CE-L24LQ-EC1,两台设备使用的交换网板是CE-SFU12A

CE-L24LQ-EC124*40GE单板,总带宽960GCE-SFU12AA类交换网,在板满插6块时分给每槽位带宽只有720G,因此24*40GE单板搭配A类交换网板时跨板转发有收敛,无法全线速。

如图所示,24*40GE单板可分成4个端口组,每端口组包括640G端口。A类交换网板分给每个端口组的带宽不是平均的,绿框所示端口组带宽为240G,红框所示端口组带宽为120G,这样绿框端口组基本线速,而红框端口组收敛比为2:1

综上所述,在使用CE-SFU12A类交换网板的时候,这些40GE接口都不能达到线速转发。当流量超过内部限制时就会出现丢包情况,虽然接口利用率还不大。丢包后就会出现视频卡顿、花屏、马赛克等问题现象。

解决方案

临时解决方案:根据现场40GE接口的利用率,关闭部分红色框的40GE接口。让流量尽量走绿色框的接口进行转发。

根本解决方案:将现有的交换网板更换为C类的交换网板,让所有业务板能够达到线速转发。

建议与总结

在对设备进行扩容的时候,一定要充分了解设备之前的配置情况,考虑一定要周全。

END