FAQ-慢盘确认方法

发布时间:  2014-10-17 浏览次数:  237 下载次数:  0
问题描述
慢盘确认方法是什么?
解决方案
1、OSM界面告警确认:

观察OSM管理界面有无告警ID为5613的硬盘响应慢的告警,并确认该硬盘是否已被隔离(状态为重构完成),若仍未被隔离,请参照风险盘更换方法案例进行手动处理;


2、SES日志确认:
收集存储的SES日志信息:获取 /OSM/log_conf_local/log/cur_debug 目录下有关的SES_log.txt 或者其bak文件,查看慢I/O记录,观察I/O分布的情况,关键词:Disk IO Delay。

--------------------------Disk IO Delay Count------2012-01-10 02:30:52--------------------

Disk IO Delay Count Threshold: [300ms] [500ms] [700ms] [1000ms]

[0][2][3LM4JYJJ00009844V79S][3, 5, 15, 1]

上述表示的意思为:在5分钟内,(0,2)槽位的硬盘超过300ms的I/O数位3个,超过500ms的I/O数位5个,超过700ms的I/O数为15个,超过1000ms的I/O数为1个。

如果出现同一块盘频率非常高的出现该记录,则有可能是该盘导致的I/O延迟过长,请参照风险盘更换方法案例进行手动处理该盘。

如有疑问及时联系技术人员处理。

3、message日志确认:
收集存储的message日志信息:获取 /OSM/log_conf_local/log/cur_debug 目录下有关的message 或者其bak文件,查看关键词:long time。

Jun 20 14:45:25 OceanStor kernel: [21086119188]mptscsih SLOW IO INFO: cost  long time  (13135), host id(0), channel id(0),  scsi id (14), lun id(0), io lenth (524288), io mode(1), io lba(0x215321088)

可知scs id为14的scsi设备出现了挂I/O的情况。

登录存储的Debug模式,输入lsscsi,获取scsi ID对应的盘符然后登录存储的MML模式,输入dev disk 框号,获取槽位号对应的盘符;




如上图,SCSI ID为6的设备盘符为 /dev/sdc ,通过dve disk 命令获取 盘符为 sdc的硬盘为0号框的2号槽位。

4、慢盘确认:
若是在日志中(SES日志和message)出现慢I/O的频率非常高,且在业务受影响(如视频卡)的时间点附近,也有此打印,则该盘可能为影响业务的盘,可以判定:

此硬盘为慢盘。





END