NE20设备E1捆绑,友商MCU告警乱序

发布时间:  2017-03-29 浏览次数:  190 下载次数:  0
问题描述

本地MCU---100M---NE20---2*E1捆绑----传输长途链路-----异地MCU

告警信息

1、NE20设备无告警;

2、本地MCU无告警;

3、异地MCU告警乱;出现画面马赛克,声音不连续;

处理过程

一、验证故障现象:

1、NE20设备2*E1做MP-Group,建会测试,异地友商MCU告警乱序,出现画面马赛克。

2、ping测本地MCU至NE20链路,1500大包测试无丢包。

3、ping测试NE20设备MP-Group链路,1500大包测试无丢包,延时正常。


二、将E1捆绑拆除测试单E1链路

1、ping测试NE20设备第一条E1链路,1500大包测试无丢包,延时正常。

2、ping测试NE20设备第二条E1链路,1500大包测试无丢包,延时与第一条E1链路对比要高出许多。

3、NE20设备使用第一条E1链路,测试MCU建会,异地友商MCU乱序告警消除,画面无马赛克,由于是单链路,带宽不足,但偶尔会出现丢帧;

4、NE20设备使用第二条E1链路,测试MCU建会,异地友商MCU乱序告警消除,画面无马赛克,由于是单链路,带宽不足,但偶尔会出现丢帧;


三、E1捆绑后故障重现;

四、分析告警产生原因
1、通过友商MCU沟通,告警产生原因是,MCU在收到报文会检查,报文发送顺序如果和发送顺序不一致,就出现乱序告警。当乱序报文太多,就会出现马赛克、丢帧等。
2、查询NE20文档,MP-Group部署方式为负载分担。会应为链路质量等因素导致报文到达接收方的顺序和发送顺序不一致。


根因
1、当MP-Group接口中绑定了多个捆绑链路时,由于捆绑链路的物理特性和分片报文的大小可能存在差异,会导致报文到达接收方的顺序和发送顺序不一致。
2、对于IP报文,失序报文可以根据IP首部的片偏移字段自动进行重组。但是当对报文的顺序有严格要求,而对失序报文没有有效重组机制时,MP报文失序可能会导致网络性能严重下降甚至网络变为不可用
解决方案

一、在 mp-group接口下开启报文保序功能;

步骤如下:

1、进入MP-Group接口视图

2、使能MP-Group接口上的报文保序功能 (ppp mp reorder)

3、重启MP-Gro重启  3、重启MP-Group接口(restart)或者可以在MP-Group接口下直接执行restart命令或依次执行shutdown和undo shutdown命令;

                   

二、配置完成后,测试业务正常,故障消失。

 


建议与总结

本案中,

1、当MP-Group接口中绑定了多个捆绑链路时,会因为不同链路的质量不同,导致报文在链路传输过程中时延不一致,会导致报文到达接收方的顺序和发送顺序不一致。

2、对于IP报文,失序报文可以根据IP首部的片偏移字段自动进行重组。但是当对报文的顺序有严格要求,而对失序报文没有有效重组机制时,MP报文失序可能会导致网络性能严重下降甚至网络变为不可用

从而到时异地MCU在收到报文收方的顺序和发送顺序不一致,就出现乱序告警。

END