EM6T单板直连IFH2单板ETH口导致端口异常限速网元大量丢包问题

发布时间:  2013-05-20 浏览次数:  147 下载次数:  0
问题描述
N国E项目反馈多个站点在忙时存在大量丢包问题,现网拓扑如下,6550为汇聚站点,与OSN对接。
问题现象为6550站点及其下挂的站点的node B在每天的忙时都存在大量的丢包统计。



无。






处理过程
丢包的可能性主要有以下几种:
1、链路性能问题导致丢包
2、链路带宽不足导致丢包
3、单板硬件故障,网线,光纤松动或质量问题导致丢包
从网元告警和链路性能分析,无链路告警,链路性能正常
从问题现象分析,汇聚站点和下挂站点都在忙时丢包,重点怀疑在6550站点忙时存在带宽不足的原因导致丢包。
根因
ACM报文被异常转发
解决方案
1、一线最初只反馈了6650站点NE ID 为6650的网元,从返回的数据分析,发现此网元存在大量超出带宽的丢包计数,GE2口被限速到了45M,初步判断是此网元GE2口对接的IFH2单板链路带宽为45M导致端口被限速,忙时采集的数据可以看到端口平均流量已经达到了45M,基本可以确认忙时丢包是因为带宽不足导致的。

2、一线重新检查站点配置后发现ID 为6550的网元GE2口并没有直接连接到IFH2单板,而是像上面拓扑图显示的那样,GE2口连接到26550的EM6T的GE2口,然后通过26550的GE1口汇聚到上游设备。而这种情况下,6550的GE2口是不应该被限速的。

3、对于RTN600网元,中频板和EMS6数据板之间是通过网线连接实现数据业务交换的,中频调制模式可传输的最大数据业务带宽会通过ACM报文发送给与中频板ETH口对接的 EMS6单板的ETH口, EMS6单板收到ACM报文后就会根据报文内容对此ETH口进行限速。此问题EMS6单板端口对接的是RTN900的EM6T单板的GE口,正常情况下是不会被限速的,怀疑是其他网元的ACM报文被转发到了此端口,导致端口被异常限速。
4、继续排查发现26550的FE2口接到了本站另一个RTN600的IFH2单板的ETH口上,而26550网元又配置的是802.1d网桥,从而导致IFH2单板的ACM报文通过26550透传到6550网元的EMS6单板GE2口上,GE2口被限速。
5、RTN900网元可以通过端口OAM的一些配置终结ACM报文,通过此规避方法消除了6550网元EMS6单板GE2口的限速,忙时丢包问题解决。
建议与总结
1、现网组网规划应尽量避免出现IFH2单板ETH口直接连接到RTN900的数据板ETH口的情况。
RTN600网元与RTN900网元的连接尽量通过数据板之间的互联实现数据业务交换。
2、如果由于单板或端口资源紧张,必须采用IFH2单板ETH口与RTN900数据板ETH口直连,建议RTN900上配置802.1q 网桥,这样可以避免ACM报文被转发到其他EMS6单板。
3、反馈网络组网图时,务必要准确,全面,避免信息不全增加问题分析时间。

END