5300V3导出日志提示A控内存容量不足

发布时间:  2016-12-31 浏览次数:  233 下载次数:  0
问题描述
5300V3导出日志失败,提示A控内存容量不足
告警信息
处理过程

1、minisystem下查看环境A控当前内存使用情况,内存剩余137MB。


进一步查看A控64字节的内存块(kmalloc-64)计数为5313024,并且还在继续增长,其他类型的内存无此现象。


查看B控,当前剩余243MB,还未到达日志无法导出的阈值。
2、分析日志和配置信息,阵列NFS共享有593条配置记录,NFS相关用户配置每隔16分钟会更新到内核。


3、确认客户环境为V300R002C10SPC100双控阵列且没有打SPH105补丁,操作日志看到A、B控自最近一次重启后大致已持续运行时间为17个月。
A控比B控持续运行多大致半个月。至此基本确认内存不足是由NFS共享更新配置导致的内存泄露导致的。

根因

NFS共享配置由Devicemanager界面配置,之后更新到内核,以便于业务中能迅速根据配置来匹配鉴权(如果每次都来上层查询,会很耗时)。
配置刷新发生在两种场景:
1. Devicemanager界面上有一次NFS共享配置操作。
2. 每隔16min会主动刷新,目的为了保证内核缓存保持实时最新。
向内核刷缓存中间涉及到内存的申请释放,站点存储版本内存释放流程存在不合理,导致内存逐步泄露。

V300R002C10SPC100版本存在内核刷新NFS共享配置会导致kmalloc-64泄露的问题

解决方案
临时规避措施
1、安装V300R002C10SPH102;
2、先后重启阵列控制器。
解决方案
1、升级到V300R002C10SPC200+ V300R002C10SPH203

END