实时统计短时间流量问题导致端口输出速率超过门限告警

发布时间:  2012-07-27 浏览次数:  93 下载次数:  12
问题描述
该问题在8090路由器上多个版本出现,现象为:网管每隔半个或者1个小时上送告警,告警同时或者1S之内清除(告警内容见附件)。在NE40E路由器的上执行命令:dis trapbuffer,能看到如下端口输出速率超过门限的trap信息:
#Jun 25 10:08:08 2009 XXX-XXX IFNET/4/INBWRATEEXCEED:Slot=10;OID 1.3.6.1.4.1.2011.5.25.41.4.5 Interface input flow bandwidth usage exceeded the trap threshold. (Interface=671089030, BandWidthUsage=888, TrapThreshold=100)
上面的告警在下一秒又立刻恢复了
#Jun 25 10:08:09 2009 XXXX-xx IFNET/4/INBWRATERESUME:Slot=10;OID 1.3.6.1.4.1.2011.5.25.41.4.6 Interface input flow bandwidth usage was restored to the trap threshold. (Interface=671089158, BandWidthUsage=23, TrapThreshold=100)
告警信息
见附件。
处理过程
NE40E&NE80E的补丁版本为:V300R003C00SPH021;NE500E的补丁为:V200R003C02SPH017。
根因
出现问题的原因是实时统计端口的短时间流量时,考虑不周,出现获取时间间隔被缩小,会出现误判断端口的瞬间速率比真实速率大很多倍,然后又立刻恢复的情况;这种情况下网管会端口带宽超限告警,然后又立刻恢复。 
出现该问题的版本为:NE40E&NE80EV300R003C02B697 和 NE40E&NE80EV300R003C02B608;
NE5000E V200R003C02B609。
建议与总结
该问题会通过trap信息上送网管,网管上会打印大量告警,请及时查看路由器上的trapbuffer中是否有符合上述的相关记录,如果有,请查阅补丁描述,如果符合补丁的版本要求,打补丁解决;如果不符合,请联系研发解决。

END