FAQ-FusionInsight HD V100R002C50版本故障磁盘更换操作

发布时间:  2017-02-17 浏览次数:  114 下载次数:  3
问题描述
大数据平台FusionInsight_HD V100R002C50有12014的告警 ,业务(数据节点)RH5288服务器上有硬盘亮红灯,且硬盘所在的槽位不是系统盘槽位。故障硬盘是单独配置raid0

解决方案
1.打开FusionInsight Manager页面,在“Alarm Details”区域,从“Location”中获取“HostName” 同时与客户确认FusionInsight节点类型。经确认为数据节点。
2.在实时告警列表中,检查系统上报“ALM-12014 分区丢失”告警后,检查故障节点的“/etc/fstab”文件中该硬盘的mount记录是否已经删除。如果没有删除需要编辑“/etc/fstab”文件,手动删除该硬盘的mount记录。
3.检查故障节点的所有磁盘状态,执行ps -ef | grep -v "grep" | grep "diskmgt"命令,查看系统中是否存在diskmgt进程。如果没有需要手动安装。
4.到机房直接拔出坏掉的磁盘并更换新的磁盘
5.关机重启,进入raid卡配置界面,清除故障盘的缓存信息,重新配置RAID0。配置完成后重启服务器进入OS。
6.启动操作系统后,diskmgt进程会自动进行磁盘分区、格式化、挂载等处理,约需要30分钟(视磁盘容量,处理时间会不同)。执行mount命令,检查硬盘是否已挂载目录。是,登录FusionInsight Manager,手动清除该硬盘对应的告警(“ALM-12014 分区丢失”),操作结束。
需要确认几点:
建议关机配置RAID阵列信息,配置raid要确认故障盘所在的RAID0,清除该raid的缓存信息后重新配置RAID0。

3.更换完成磁盘后,需要再确认故障是否恢复。同时需要手动清除故障告警。

END