S5600T存储某个LUN上数据文件夹丢失问题处理

发布时间:  2014-10-13 浏览次数:  175 下载次数:  3
问题描述
xx局点S5600T存储连接DELL M1000e刀片服务器,于2014-10-10  15:00左右发现存储上其中一个LUN(操作系统上对应G盘)中文件夹gzdcattachment丢失,业务不可用。16:52接到400电话反馈。
告警信息
1、业务软件无法正常访问存储,发现文件夹丢失。
2、存储共划分3个LUN,对应操作系统中3个磁盘,发现其中一个LUN对应的磁盘G使用情况与真实文件容量异常。磁盘属性显示使用125GB,所有文件夹容量为60M+。
处理过程
1、 登录业务服务器,查看所有磁盘都在,多路径显示正常;
2、 通过与业务软件厂家沟通,存储共划分3个LUN,对应操作系统中3个磁盘,发现其中一个LUN对应的磁盘G使用情况与真实文件容量异常。磁盘属性显示使用125GB,所有文件夹容量为60M+,如下截图:


3、 使用存储巡检工具ISM ServicesTools SPC800对存储巡检,巡检结果为正常;
4、 通过信息收集工具ISM ServicesTools SPC800收集存储底层日志,反馈研发分析,研发反馈存储正常;
5、 通过与客户协调管理员以及业务软件厂家沟通,并没有误删除的动作。
6、 再次与研发沟通,由于业务主机操作系统是windows 2003平台,建议通过Winhex软件对对应磁盘查看,是否存储原来文件,并尝试恢复;
7、 通过与客户管理员以及应用厂家,确定需要恢复的具体文件夹。
8、 通过Winhex软件恢复客户丢失的文件夹gzdcattachment。
a) 通过Winhex打开数据误删除或者文件系统损坏所在逻辑驱动器或者物理磁盘;
b) 在目录浏览区找到故障分区,用鼠标左键双击进入,如图3-18:

图3-18进入分区
c) 通过磁盘数据区找到所要恢复的文件,单击鼠标右键,选择 恢复/复制选项,确定
存放目标文件夹,点击确定,如图3-19所示:

图3-19 恢复文件

9、客户管理员以及应用维护工程师尝试验证业务,确认正常。
根因
关于本次存储上数据丢失,向客户解释如果存储异常,出现数据丢失的应该是整个LUN(对应整个G盘)或者所有的LUN上数据异常。
存在这种情况可能原因:
1、 应用软件是否存在误删除的可能,建议适当的时候排查一下。
2、 操作系统存在Bug,导致系统中某个文件夹突然丢失。建议客户更新操作系统最新补丁。
(该类似问题,研发反馈桌面云系统中已经存在)
解决方案
通过Winhex软件恢复客户丢失的文件夹。
建议与总结
1、 如果再次出现类似问题,建议不要继续往该磁盘写入数据,由于有新数据写入后,会覆盖原来的文件,将导致无法全部恢复或者全部无法恢复的可能;
2、 由于客户业务数据的重要以及机密性,建议客户购买一套备份系统,将重要数据做备份。

END