MP-Group接口因缓存队列满导致报文丢失的问题处理

发布时间:  2012-07-27 浏览次数:  62 下载次数:  0
问题描述
某IP承载网,NE40E采用V300R006C01版本,站点之间使用E1微波传输,NE40E配置E1捆绑成的MP-Group接口,采用crpt语音压缩功能;整个IP承载网主要配置MP-BGP MPLS L3VPN,公网路由配置ISIS动态路由协议。随之BSC不断的割接中,网络承载话务量也快速增长,在客户业务高峰期时段(7点-9点),基于IP承载的核心网语音存在比较严重的丢包现象,丢包率最高达9.1%,导致语音质量受到严重影响
告警信息

处理过程
将NE40E的MP-Group发送的报文进行分片成小于128字节的小包,降低报文的缓存时间,规避丢包问题。MP-Group接口模式下增加如下分片命令:
Interface Mp-group1/3/2
 Fragment-threshold 0
增加如上命令后,观察业务在高峰期,无严重丢包现象,该问题已解决。
根因
1、非业务高峰期,检查各站点NE40E之间ping互联地址操作不存在严重丢包,核心网语音丢包率下降很低水平(<0.5%)
2、业务高峰期,检查各站点NE40E之间ping互联地址存在严重丢包,检查基于微波的每根E1传输不存在丢包,确认E1传输没有问题,但为什么E1捆绑后MP-Group接口确出现丢包呢?
3、经分析:语音报文从链路源端MP-Group发送分片报文通过传输到宿端MP-Group,宿端MP-Group接口再根据报文序列重新组成语音报文;报文有大有小,传输传送时间也不等,所以宿端MP-Group将先到的报文列入报文缓存队列,等所有报文全部接受后再重新组装新报文;非业务高峰期,NE40E的报文缓存队列还可以应付,一旦业务高峰期,大量报文涌入导致接口缓存队列满,后续新报文无法被列入缓存队列而被丢弃,结果造成了大量报文丢失。
建议与总结

END