FusionInsight HD V100R002C30LCN001 备OMS补丁安装失败问题

发布时间:  2016-09-08 浏览次数:  164 下载次数:  0
问题描述

集群版本:V100R002C30LCN001

集群规模:81(6管理控制节点)

补丁版本:V100R002C30LCN001SPC002

问题现象:FusionInsight HD V100R002C30LCN001补丁升级过程中备OMS补丁安装失败


处理过程
1.检查补丁安装日志内容/var/log/Bigdata/patch下日志,搜索error关键字,可定位到有controller.properties文件同步失败的问题;
2.分析补丁V100R002C30LCN001SPC002补丁包安装过程,OMS补丁需要修改controller.properties文件; 
3.补丁安装过程先执行主OMS补丁安装,安装完主OMS补丁后,由于未禁用HA文件同步功能,主OMS节点开始往备OMS节点同步文件; 
4.主OMS节点补丁安装完后,马上开始备OMS节点的补丁安装,当补丁脚本修改controller.properties时,主OMS节点正同步该文件到备节点,两个进程同时操作controller.properties,导致文件修改失败; 
5.重试过程中,由于主OMS节点已经安装补丁成功,直接跳到备OMS节点进行补丁安装,此时HA已经完成了文件同步操作,不会存在同时修改同一个文件的场景,补丁安装成功。
根因

补丁安装过程中,未关闭HA文件同步功能;当主OMS节点的文件变更后,实时同步到备OMS节点,补丁脚本中也会修改主OMS正在实时同步的文件,当两个进程同时操作同一个文件时,有几率导致备OMS节点补丁升级失败。

解决方案

在补丁安装流程中,关闭文件同步功能,补丁安装完成后,再启用文件同步功能。

1、补丁安装前,登陆主OMS节点,切换到omm用户,执行如下命令,关闭主备文件同步功能: 

/opt/huawei/Bigdata/OMSV100R001C00x8664/workspace/ha/module/hacom/tools/ha_client_tool --ip=127.0.0.1 --port=20013 --disabledsync --name=product 

2、丁安装完成后,登陆主OMS节点,切换到omm用户,执行如下命令,开启主备文件同步功能: 

/opt/huawei/Bigdata/OMSV100R001C00x8664/workspace/ha/module/hacom/tools/ha_client_tool --ip=127.0.0.1 --port=20013 --enabledsync --name=product

建议与总结

升级补丁前需要严格按照升级checklist内的要就检查升级条件是否满足,如果有不满足的项,需要修复问题后再继续升级步骤。

END