V3系列存储开局设备上电出现CCDB开工失败导致系统无法开工问题处理案例

发布时间:  2016-10-11 浏览次数:  242 下载次数:  0
问题描述
V3存储开局设备上电后,系统一直无法正常开工;查看告警列表,会出现“系统工作异常,不能提供业务服务/(The system is abnormal and cannot provide services)”的告警。
告警信息
查看告警信息,有“The system is abnormal and cannot provide services.”的告警(告警ID: 0xF00CF0035)。
处理过程
方法一:

1、在DeviceManager界面导出存储日志,查看控制器目录下的\Other\ctrl_info文件确认上电异常原因。

2、搜索关键字:sys showtrace,确认文件中status为Failure的字段对应的FlowId号。

如下图:FlowId为23的流程状态为Failure

3、继续通过FlowId搜索关键字:sys showtrace [FlowId],查看FAIL ACTION的位置是否为NtfCCDBStart。

如上图:FlowId为23,则搜索关键字sys showtrace 23,发现FAIL ACTION为NtfCCDBStart,标明此次存储上电异常是由于CCDB开工开始导致。

方法二:

同样可以登录CLI,并进入diagnose模式,按照方法一的命令,依次输入:

sys showtrace和sys showtrace [FlowId]两条命令,通过回显结果判断存储上电异常的原因。

满足上述特征,则确认是该问题。
解决方案
1、对开工失败引擎的每个控制器,依次进入minisystem模式。

2、执行ccdb.sh -c clearccdb命令,清除CCDB信息。

3、依次在每个控制器执行rebootsys命令,重启控制器。

4、控制器重启后即可恢复正常。

END