S2600T存储部分LUN不可用的问题

发布时间:  2016-11-02 浏览次数:  148 下载次数:  3
问题描述
某市公安局局点,使用S2600T(V1R5C01)存储提供视频监控业务,映射给上层3台Windows 2008 Server R2服务器所做的故障转移群集。因群集故障后无法修复,将群集改为单机时发现原集群中部分LUN资源无法使用,文件系统状态为RAW,点击打开磁盘时报错“无法访问,请求的资源正在使用中”。(故障状态截图见附件)
告警信息

管理控制台无告警信息

处理过程

1、将无法使用的LUN映射给另一相同操作系统的主机,发现报错相同。

2、停止群集中故障的两台主机的群集服务,问题依然存在。

3、使用多路径收集工具收集多路径日志,并查看存储日志后发现因上层主机将磁盘预留导致其余主机无法访问。

4、重启集群中备节点并将LUN组中无法访问的LUN与主机组解除映射后,重新映射,故障得到解决。

根因

多路径日志记录如下:

[3738][2016-10-16 11:9:51:806000][000053410662071a][WARN][VDS][VDS_HSSpecificCmdError][1818]Cmd scsi status is "reservation conflict", action is "pass to upper layer".op {0x2a},cmd {275},(disk (1),tpg {1},path {0})

分析:为对于集群主机,由于多个主机都可以看到同一个lun,为避免多个主机同时对LUN读写,造成数据损坏,因此在一个主机要访问LUN前,需要先向给LUN发起预留,成功后才能访问LUN

而局点主节点主机访问其中部分LUN时报错无法访问,申请资源正在使用中,是因为被其他备节点预留了,导致主节点无法访问。

解决方案

1、先将无法访问的LUN映射给另一相同操作系统的主机,若该主机能正常访问说明存储无异常,协助客户在主机层面排查原因。

2、若依然无法正常访问,请与客户确认群集主机是否有停机维护窗口,重启备节点释放节点预留的资源。

建议与总结

预留是主机行为,因此如果上述方式无法释放LUN预留,建议客户向集群厂商求助。

END