现网整改存储级联线导致数据硬盘单链路

发布时间:  2016-01-14 浏览次数:  209 下载次数:  2
问题描述

某存储局点,工程施工时存储级联线走线不符合工程质量要求,存储设备入网后,客户要求进行整改,需要对入网带业务的存储级联线进行拔插,操作实施过程中拔出级联线后,未等待三十秒就插入了级联线,结果导致级联的硬盘框出现10块数据硬盘单链路故障。

处理过程

硬盘单链路故障,可能原因:
1
、级联线物理连接异常;
2
、逻辑上数据链路异常。

1
、检查级联线的物理连接和指示灯,都正常,且同硬盘框中其它数据硬盘状态正常;
2
、检查硬盘的逻辑数据链路,具体步骤如下:
进入admin模式(默认密码:Admin@storage),执如下操作
showdisk -e n -s m  #n
为硬盘框号,m为硬盘号
显示结果如下,可以确认Slave Path链路异常
  Disk Location           | (5,21)
  Type                    | Member
  Associated Disk         | --
  Reconstruction Progress | --
  Capacity(GB)            | 558
  RAID Group ID           | 3
  Pool ID                 | --
  Copybackable            | Yes
  Logical Status          | Normal
  Is Halflife             | No
  Physical Status         | Single path
  Master Path             | Normal
  Slave Path              | Fault
  Running Time(Hours)     | 4128
  Temperature(Celsius)    | 29
  Speed(RPM)              | 10000
  World Wide Name         | 5d4b110ac6add015
  Vendor                  | Seagate
  Model                   | ST600MM0006
  Firmware Version        | 0003
  Serial Number           | S0M4E9440000K522JP84
  Physical Type           | SAS
  Current Speed(Gbps)     | 6.0
  Current Ctrl Type       | SAS
输入developer进入developer模式(默认密码:debug@storage
对故障硬盘执行如下操作
simudiskout -e n -s m -o 0  #n
为硬盘框号,m为硬盘号
  developer: admin:/>simudiskout -e 5 -s 21 -o 0
  command operates successfully.
等待三十秒后,再执行如下操作
simudiskin -e n -s m -o 0  #n
为硬盘框号,m为硬盘号
  developer: admin:/>simudiskin -e 5 -s 21 -o 0
  command operates successfully.
输入exit回到admin模式,执如下操作
showdisk -e n -s m  #n
为硬盘框号,m为硬盘号
显示结果如下,可以确认Master PathSlave Path链路都正常
  Disk Location           | (5,21)
  Type                    | Member
  Associated Disk         | --
  Reconstruction Progress | --
  Capacity(GB)            | 558
  RAID Group ID           | 3
  Pool ID                 | --
  Copybackable            | Yes
  Logical Status          | Normal
  Is Halflife             | No
  Physical Status         | Normal
  Master Path             | Normal
  Slave Path              | Normal
  Running Time(Hours)     | 4128
  Temperature(Celsius)    | 29
  Speed(RPM)              | 10000
  World Wide Name         | 5d4b110ac6add015
  Vendor                  | Seagate
  Model                   | ST600MM0006
  Firmware Version        | 0003
  Serial Number           | S0M4E9440000K522JP84
  Physical Type           | SAS
  Current Speed(Gbps)     | 6.0
  Current Ctrl Type       | SAS

根因

数据硬盘逻辑链路连接异常,导致硬盘单链路故障。

解决方案

因数据硬盘为现网RAID5存储块,为保证数据安全,只能后台对硬盘进行逻辑拔插,恢复硬盘的数据链路。

建议与总结

1、存储级联线拔出后,必须等待三十秒再插入;
2
、当硬盘框的数据硬盘出现单链路故障时,切记盲目去进行物理拔插操作,会破坏RAID组数据。

END