OceanStor 18500存储8GB FC卡损坏导致归属控制器掉电

发布时间:  2015-09-09 浏览次数:  119 下载次数:  0
问题描述

某局点一套OceanStor 18500在运行中,一个控制器突然异常下电,导致集群单控运行,该节点重新手动上电失败。在DeviceManager查看告警ID为0xF00CF0014,显示控制器无法监控,该控制器为损坏的PCIE卡对应的控制器。通过命令行查看有如下告警:

处理过程

使用SSH工具登录阵列集群主的CLI,进入developer模式后,输入“debug”,进入调试模式,使用命令sys showtrace查询系统流程,有“FlowId”值为10、11和13的流程,其中id为10和13对应的“status”值为Success,id为11对应的“status”值为Failure,如下图所示:



再执行sys showtrace 11,查询该流程,显示“FAIL ACTION: SelfCheck: CheckPcieLinkByXnet”字样,如图所示:



更换故障卡后解决。

根因
控制器的PCIE接口模块损坏或者被拔出。
解决方案

更换该8GB FC卡解决。再次对节点手动上电成功,上电成功之后在节点的CLI模式下使用show controller general能查询到对应的控制器信息。

END