OceanStor 18800 存储V1R1C00 阵列不能被管理

发布时间:  2015-11-06 浏览次数:  456 下载次数:  0
问题描述
用户现网环境OceanStor 18800 存储出现红灯告警,登录DeviceManager后,查看告警信息,报阵列不能被管理告警,告警ID 0xF00C90014。用户18800存储版本V100R001C00SPC200。整柜交付,单柜组网方式。
告警信息
设备红色指示灯告警,告警信息为:阵列不能被管理,告警ID 0xF00C90014。
处理过程

1、确认阵列和SVP间的级联线是否拔出或者损坏
 

如果是,则重新插好级联线,观察告警是否恢复。
    如果级联线完好或者更换后告警仍存在,则进行第
2步。
 

2、确认现场版本是否为18000 V100R001C00SPC200及以下版本
 

3、重启各控制器的MMT进程
 

4、进程重启后,阵列不能管理故障恢复,告警解除。

解决方案


需要重启阵列MMT进程,SVP上登录各个控制器IP


1、进入minisystem模式


输入change user_mode current_mode user_mode=developer进入developer模式,默认密码debug@storage,然后在developer模式下输入minisystem,进入minisystem模式。


2、在minisystem下执行ps –ef


在回显中查看MMT进程(/OSM/bin/mmt)的进程ID(第二列参数),如下图所示:


3、重启mmt进程


minisystem下执行kill -9 6844(上图红框标注的进程ID)。执行完成之后,进程会自动被重新拉起。如下图所示:



4、查看mmt信息


minisystem下执行ps -ef查看mmt进程的信息,此时进程ID已经变化,ID变化则说明进程重启成功。



5、退出minsystem


执行logincli退出minisystem

建议与总结
经与客户沟通,故障出现的环境及可能原因为:客户机房空调故障宕机,导致机房温度高温,一部分服务器宕机,存储出现高温告警,后空调恢复后,存储出现不能管理告警。而咨询400研发后得出的原因为: 第三方软件OpenSSL漏洞导致服务端(阵列)MMT同管理服务器(SVP)DeviceManger建立连接失败。 建议机房保证空调正常运作,维持正常温湿度,给设备提供良好的工作环境,以免诱发不必要的软硬件故障。

END