NE40E下的语音用户丢包问题

发布时间:  2016-02-15 浏览次数:  158 下载次数:  5
问题描述

    某公司一台NE40E下挂大量语音用户,在NE40E下连设备ping其网关有丢包现象,丢包率为8-10%左右。故障出现后,插拔与下行设备连接的光纤,或NE40E光模块插拔业务都能恢复,但不定时的故障还会出现。出现故障的都是NE40E下面ONU的语音用户,出现语音电话通话故障,客户更换过NE40E的端口和光模块及S9712的端口及单板和光模块,还更换过NE40E的单板,并没有解决问题。


 

告警信息

处理过程

步骤1、在S9712上查看MAC地址学习情况,发现OUNMAC地址在S9712的下行口, 属于正常。

步骤2、查看S9712ARP 没有发现异常,没有发现MAC飘移。

< 9712 >display arp

IP ADDRESS      MAC ADDRESS     EXPIRE(M) TYPE        INTERFACE   VPN-INSTANCE

                                          VLAN/CEVLAN

------------------------------------------------------------------------------

xx.xx.xx.xx   101b-54d5-ad6f            I -         Vlanif4094

xx.xx.xx.xx   0018-823f-e70a  20        D-0         GE3/0/0

                                          4094/-

------------------------------------------------------------------------------

Total:2         Dynamic:1       Static:0    Interface:1 

 

步骤3查看S9712是否存在环路,没有发现异常,不存在环路。

<9712>display loop-detection

Loop Detection is enable.

Detection interval time is 5 seconds.

Following vlans enable loop-detection:

NULL

Following ports are blocked for loop:

NULL

Following ports are shutdown for loop:

NULL

Following ports are nolearning for loop:

NULL

Following ports are traped for loop:

NULL

步骤 4NE40E上做PING 测试,在S9712 下行口抓包和S9712上行口抓包,并进行数据分析,发现数据包ARP请求已经发给NE40E,由此定位为问题出在NE40E上。

步骤 5、通过DEBUG和抓包分析,发现收到的ARP 请求报文的速率太快,ARP报文速率超过允许通过的阈值,至此问题定位。

根因
NE40E上同一VLAN的用户过多,下端ONU设备 MAC 地址老化时间较短,致使下端用户请求的ARP超过接口阈值,而NE40E 接口默认值不能满足现网的需求,从而造成丢包。
解决方案
使用arp rate-limit 命令设置端口允许通过的ARP报文的速率,阈值为100 
建议与总结

后期建议客户合理规划子接口的IP地址及vlan 值,减小广播域,防止类似问题的再次发生。

END