IT技术案例-S2600T V2意外下电导致服务器连接存储时卡死

发布时间:  2015-11-17 浏览次数:  256 下载次数:  4
问题描述

S2600T存储下电后,主机(windows2003)连接该存储时可以扫到磁盘,但是打开磁盘空间时操作系统卡死,数据无法正常读取,尝试另外一台服务器连接存储时一样卡死,存储端无硬件告警,硬盘无故障。

告警信息

现场无硬件告警,主机连接存储时操作系统卡死。

处理过程

1.      重新在存储端创建一个10G LUN,连接到服务器,确认10G存储能读取到,排队存储硬件故障。

2.      在服务器端使用chkdsk c:/fc代表盘符)命令修复故障LUN数据索引项,确认完成。

3.      故障LUN数据仍然不可读取,在该存储上新建跟故障LUN空间大小相同的LUN,使用WinHex工具将故障LUN中的数据恢复并拷贝至新建LUN

4.      数据恢复完成,确认服务器读取到所有数据,删掉故障LUN,让客户将业务切换至新建LUN

5.      提醒客户设备下电按照基本流程,并建议客户对重要数据进行备份保护,减少损失。

根因

存储意外下电,导致硬盘中部分数据索引项丢失,因为客户存放数据量大(600万个随机小文件),数据索引项丢失量较大,所以服务器端连接存储时卡死。

建议与总结

存储系统设备上下电应该严格遵守上下电顺序:

上电:打开各设备对应的外部电源开关 按控制器上的电源按钮 打开以太网交换机或光纤交换机的电源开关 打开应用服务器的电源开关

下电:停止主机业务 同时按下两个控制器上的电源按钮5秒钟 断开控制框和硬盘框的外部电源。

应用服务器不能使用存储空间,应先排查硬件和链路是否故障,如果有故障,检修故障件或者链路,如果没有,很可能是数据出现故障,需要对数据进行修复和恢复,尽量将客户数据全部恢复,同时提醒客户备份重要数据并安全使用设备。

END