18000 DeviceManager出现阵列不能被管理告警

发布时间:  2015-10-31 浏览次数:  221 下载次数:  0
问题描述

DeviceManager上出现“阵列不能被管理”告警,告警ID 0xF00C90014,如图:

 

解决方案

第三方软件OpenSSL漏洞导致服务端(阵列)MMT同管理服务器(SVP)DeviceManger建立连接失败

排查步骤:

1、确认阵列和SVP间的级联线是否拔出或者损坏

如果是,则重新插好级联线,观察告警是否恢复。如果级联线完好或者更换后告警仍存在,则进行第2步。

2、确认现场版本是否为18000 V100R001C00SPC200或T V200R002C00SPC200及以下版本



如果是,则应用下面的措施尝试解决问题。

如果不是,请联系华为工程师确认。

【解决措施】
需要重启阵列MMT进程,请在各个控制器执行如下操作(18000 V100R001C00需要在SVP上登录各个控制器IP;T V200R002C00直接登录各个控制器IP)。

1、进入minisystem模式

输入change user_mode current_mode user_mode=developer进入developer模式,默认密码debug@storage,然后在developer模式下输入minisystem,进入minisystem模式。

2、在minisystem下执行ps –ef

在回显中查看MMT进程(/OSM/bin/mmt)的进程ID(第二列参数),如下图所示:



3、重启mmt进程

在minisystem下执行kill -9 6844(上图红框标注的进程ID)。执行完成之后,进程会自动被重新拉起。如下图所示:



4、查看mmt信息

在minisystem下执行ps -ef查看mmt进程的信息,此时进程ID已经变化,ID变化则说明进程重启成功。



5、退出minsystem

执行logincli退出minisystem。


【适用范围】
18000 V100R001C00SPC200及以下版本。

说明:SVP主板故障告警(产生后后面又恢复)

这个告警属于误告警,告警的错误码是指一个电压异常,出了该问题,svp会复位 。原因是查询电压的时候有时候查不到的告警,后面若又查到了就会恢复,该问题在V100R001C20SPC100版本修改了



END