OceanStor VIS6000(V200R003C00SPC700)逻辑盘状态异常应急处理

发布时间:  2016-12-28 浏览次数:  107 下载次数:  0
问题描述

某局点VIS6000异构HP9500存储,由于HP存储出现坏盘及IO故障,导致VIS侧逻辑盘出现状态异常,主机侧数据库应用无法正常访问。

1、  登陆ISM界面,有磁盘的健康状态为“Failing”。

2、登陆CLI,执行vxdisk list,STATUS字段包含“failing”。



处理过程

1、CLI登录VIS主节点:

   执行vxdctl -c mode 确认VIS主节点(MASTER):

  

2、执行vxdbgdisk list,确认需要清除状态的盘组。

  

3、执行清除命令:

   vxedit -g diskgroupname set failing=off diskNickname

  

4、执行vxrecover -c -b -s 恢复卷状态。

5、执行vxdisk list检查处理结果,“failing"状态消失。

6、登录ISM查看逻辑盘健康状态正常。

根因
由于异构存储磁盘组故障有坏道,无法修复,导致VIS映射的逻辑盘故障被设备置“failing”状态以保护数据的正确性。为客户能对数据进行备份,临时使用此方法拉起故障盘。正确的处理方式应为先完成底层存储的故障处理。VIS侧一般会自动恢复,无需命令行手动恢复。
解决方案
此类场景一般为我司产品异构友商产品,在友商产品出现物理故障又未及时处理的情况下,我司为保证数据的可靠性,会对故障或检测到的有潜在故障的逻辑盘置“failing”状态,以提醒客户进行底层物理故障的处理。在本案例中,由于底层故障暂时无法修复,客户上层应用由于使用的盘被置“failing”后导致整个盘组无法使用,需要临时将故障盘踢出盘组,故采取本案例的临时处理方式,已保证客户的应用正常使用。
建议与总结
本案例中的处理方式为临时应急预案,主要针对客户上层应用急于修复备份,但底层物理故障又无法修复的场景。在处理中使用非常规的方式将failing盘强制拉起,完成客户的临时修复工作。正确的处理流程还是应该按照修复底层物理故障后,我司会在检测到正常后,恢复正常的健康状态,无需手动处理。本案例只作为非常时期的非常手段,不做正规标准处理方式。

END