如何处理FusionCompute操作系统命令执行报"Input/output error“错误

发布时间:  2015-03-10 浏览次数:  274 下载次数:  1
问题描述
某局点使用FusionCompute系统一段时间后,系统中很多命令执行都会报“Input/output error”错误,如图1所示。

图1 Input/output error

处理过程
更换硬盘。
根因
(1) 使用lsscsi命令查询系统盘的id号,如图2所示。
图2 查询系统盘id号



以图2为例,系统盘对应的id号为“0:0:0:0”,现场发生问题时实际查到的系统盘的id号为“0:1:0:0”。

(2) 进入/sys/class/scsi_device/[系统盘的id]/device目录,以现场出现问题时为例,则进入/sys/class/scsi_device/0:1:0:0/device目录,查看系统的状态发现系统盘已经出现offline,即离线状态(如图3所示),此时系统盘已经无法进行正常的读写,而系统命令都是保存在系统盘上,所以才会导致在执行系统命令时出现“Input/output error”错误。

图3系统盘离线状态



(3) 查看磁盘raid卡日志发现有“Data Scrub Corrected Medium Error”的类型错误。
图4 raid卡日志



根据图4错误类型可以确认硬盘已经损坏,需要更换硬盘。

END