网络产品NE20E-S4(V800R007C00SPC200),网管关注后设备CPU高

发布时间:  2016-04-19 浏览次数:  154 下载次数:  0
问题描述

在网管设备关注后设备的CPU高时,都是CMF占用了大部分的资源,查询接口状态。网管设备关注后设备还是有大量的SNMP请求查询接口流量。多个网管频繁并发采集设备的接口状态,且设备的接口数量不少就可能导致设备的CPU瞬时冲高。


display cpu-usage

Cpu utilization statistics at 2016-02-03 16:45:30 277 ms

System cpu use rate is : 99%

Cpu utilization for five seconds: 85% ;  one minute: 48% ;  five minutes: 38%.

Max CPU Usage : 99%

Max CPU Usage Stat. Time : 2015-08-07 10:39:21 026 ms

---------------------------

ServiceName  UseRate 

---------------------------

CMF              52%

DEVICE           10%

SYSTEM           10%

IFM               9%

IP STACK          9%

OSPF              9%

AAA               0%

ARP               0%

告警信息

这种短暂的CPU冲高理论上对业务是没有影响的,V8设备的轮询放权也不会导致其他线程饿死。暂无告警信息。

 

处理过程

通过display snmp-agent statistics查询设备收到的snmp报文统计。

采用如下措施降低CPU冲高:

1  降低网管采集设备接口状态的频率,最好可以减少不必要的网管

2  目前来看网管采集设备接口状态时基本都是采用的get方式,建议与网管联调更改网管采集方式为get-next或者get-bulk方式,设备对get-bulkget-next方式的处理相较于get方式占用的CPU资源会少一些。

根因

设备对get-bulkget-next方式的处理相较于get方式占用的CPU资源会少一些。

解决方案

采用如下措施降低CPU冲高:

1  降低网管采集设备接口状态的频率,最好可以减少不必要的网管

2  目前来看网管采集设备接口状态时基本都是采用的get方式,建议与网管联调更改网管采集方式为get-next或者get-bulk方式,设备对get-bulkget-next方式的处理相较于get方式占用的CPU资源会少一些。
建议与总结

网管采集设备接口状态时基本都是采用的get-bulkget-next方式

END