S9300交换机万兆单板端口缓存小导致突发流量下视频马赛克问题

发布时间:  2014-09-12 浏览次数:  632 下载次数:  0
问题描述
故障现象:在夜间视频点播业务高峰时段21:00-02:00,视频频繁出现马赛克现象。
组网简述:视频点播网采用单播技术,普通IP转发。视频服务器通过万兆端口上联到两台S9312,S9312通过每台4条万兆光纤向下行转发流量。万兆光纤使用三层路由负载分担,不是eth-trunk端口。
业务高峰时期,S9312上每个下行万兆端口流量达到6G左右。
S9312版本:V100R002C00SPC200+SPH023补丁
告警信息
设备无告警,但在相应的S9312出方向端口可以看到discard字段快速增长。
处理过程
在V100R002版本下,端口缓存值为固定,无法优化。
S9300在V200R001及后续版本对端口缓存的使用做了优化,在端口下配置Qos burst-mode enhanced命令可以使端口可占用的缓存达到1.5M,可以在一定程度上缓解在突发流量下导致丢包的情况。
但针对端口带宽占用率达到70%以上的场景,最终解决办法仍然建议为扩容。
根因
discard计数即“因突发流量超过端口缓存最大值后导致端口丢包的计数”。该计数增长,即说明该端口下出方向突发流量已超过端口带宽,并超过端口缓存上限,导致丢包。
当前S9312采用LE02X12SA单板,12端口万兆。该单板缓存规格为4M,但同时每个端口最大可使用缓存为0.566M。即,即使该单板上只有一个端口在使用,该端口可以使用的缓存也不超过0.566M。
因业务高峰期,端口流量已达到6G左右,这种情况下,只要有ms级的突发流量,就会导致端口缓存溢出,从而导致丢包。
建议与总结
在V100R002版本下,端口缓存值为固定,无法优化。
S9300在V200R001及后续版本对端口缓存的使用做了优化,使用12端口万兆单板时,在端口下配置Qos burst-mode enhanced命令可以使端口可占用的缓存达到1.5M,可以在一定程度上缓解在突发流量下导致丢包的情况。
但针对端口带宽占用率达到70%以上的场景,最终解决办法仍然建议为扩容。

END