FusionInsight HD元数据备份任务失败

发布时间:  2017-03-21 浏览次数:  81 下载次数:  7
问题描述

版本信息:V100R002C60U10

组网概述:14台服务器,安装redhat 6.5操作系统,分为管理网络和业务网络两个平面,均使用bond0。

故障现象:平台正常启动后,所有服务均正常,备份任务(备份OMS/DBservice/Namenode/LdapServer元数据)执行失败。

告警信息

周期备份任务失败;

详细告警情况见附件截图

处理过程

1、登录平台界面,检查所有服务均正常;

2、登录管理节点,切换到omm用户,检查oms上的所有服务,均正常;---cd /opt/huawei/Bigdata/om-xxx/sbin   ./status.sh

3、管理平台中查看告警详细信息,发现LdapServer没有成功备份;

4、查看日志/var/log/Bigdata/controller/controller.log下的日志,发现执行最大值是168,检测到166,小于168,执行失败;

5、修改备份文件保存的数量,并将原来保存的文件(/srv/Bigdata/LocalBackup/defaul-xxx)通过mv命令移走;

6、重启controller;

7、手工再次执行备份,备份成功。

解决方案

1、查看告警详细信息和日志;

2、检查各个模块和服务的状态

3、调整元数据备份数量;

4、重启controller;

5、再次执行备份

建议与总结

1、根据告警的提示进行调整,修改;

2、查看各种任务、进程状态;

3、查看相关日志信息,

4、在不影响数据的情况下,重启部分服务。

END