本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>
发布时间: 2020-08-26 | 浏览次数: 260 | 下载次数: 0 | 作者: lWX779111 | 文档编号: EKB1100054329
大数据集群版本:FusionInsight HD 6.5.1(补丁6.5.1.1)
集群规模:36
操作系统:red-hat 7.2
故障现象:
集群出现告警:12015-设备分区文件系统只读
14027-DataNode异常磁盘
12063-磁盘不可用
其中问题磁盘为:/srv/BigData/hadoopdata5
1、验证磁盘是否可用
以omm用户登录到故障节点,进入故障目录查看目录权限
cd /srv/BigData/hadoop/; ll
确认data5的权限为711
2、验证目录是否可以写入
cd data5
touch a.txt
提示:Read-Only file system
3、尝试修复
首先解绑磁盘
umount /srv/BigData/hadoop/data5
df -h //查看是否解绑成功,如umount失败,可再次执行umount操作
修复磁盘
fsck.ext4 -y /dev/sde1 //此操作需要执行3-5分钟
重新挂载磁盘
mount /dev/sde1 /srv/BigData/hadoop/data5
df -h //查看是否挂载成功
验证是否可重新写入数据
cd /srv/BigData/hadoop/data5
touch a.txt
echo "123" >a.txt
cat a.txt //如果以上步骤都执行成功,说明磁盘read only已解除
等待告警消失,其中因umount导致的“设备分区丢失”告警需要手动清除