7900话机直连S5700交换机广播风暴导致异常概率性重启

发布时间:  2017-01-05 浏览次数:  128 下载次数:  0
问题描述

M国某客户站点N站点,部分楼层话机概率性存在卡顿重启现象

拓扑信息如下



告警信息

话机日志












处理过程

1、排查话机日志发现WDT超时,初步怀疑是因为某个时段收到大量的报文导致看门狗超时,CPU得不到调度卡死,异常重启

2、排查客户网络优化VLAN规划,按照楼层每个楼层在独立的VLAN,不超过150用户

3、问题依旧出现,逐个排查所有楼层交换机接口流量统计发现存在大量的广播和组播报文


4、对指定接口进行广播和组播一致调整

[SW132-PISO1-NC-1-GigabitEthernet0/1/4]multicast-suppression
packets 200
    

[SW132-PISO1-NC-1-GigabitEthernet0/1/4]broadcast-suppression
pac 200    

5、业务观察一周未再出现,问题解决。同时话机侧进行了软件优化,保证设备在接收到过多报文时开启保护,避免卡顿重启影响客户业务


根因

1、话机本身缺少报文冲击的保护机制

2、网络中存在过多的组播和广播报文,导致话机CPU过高,看门狗超时

解决方案

1、话机版本缺陷,后续的版本已经优化算法和保护机制

2、设置合理的广播组播报文抑制参数,避免广播风暴

建议与总结
在广播网络较大的二层网络中要注意防止广播风暴的影响,VLAN不要规划过大,同时在不影响客户业务的情况下,可以考虑设置合适的风暴报文抑制阀值

END