OceanStor 18500A控自动重启

发布时间:  2015-10-30 浏览次数:  142 下载次数:  0
问题描述


告警信息


处理过程

首先确认版本:

18500 V100R001C00

初步判断无BBU故障,或者控制器故障,线路也正常。(重启后设备正常使用)

集日志:

分析日志发现有Current cfg used num:-2147483626. cfg used num should less then zero的Assert打印。确认是后台扫描导致计数器反转导致



根因


解决方案

规避措施:

在集群主控制器使用CLI命令关闭硬盘后台扫描(关闭后台扫描影响:硬盘后台扫描的功能是对硬盘上的坏道进行提前识别并进行修复,关闭后会使得硬盘坏道的提前识别及修复减少了一种手段。但坏道检测及修复还可以通过主机I/O来触发,如果是读I/O遇到硬盘坏道之后则进行降级读修复,如果是写I/O遇到硬盘坏道之后则直接写修复。同时硬盘介质扫描、SMART信息例测、慢盘检测等硬盘故障检测功能仍可以正常工作,保证硬盘可靠性)。

解决方法:

打补丁SPH303解决

END