FusionInsight HD 中ntpd服务升级

发布时间:  2017-03-21 浏览次数:  198 下载次数:  2
问题描述

版本信息:V100R002C60U10

组网概述:14台服务器,安装redhat 6.5操作系统,分为管理网络和业务网络两个平面,均使用bond0。

故障现象:客户现场redhat 6.5系统默认的ntpd服务版本为4.2.6,经安全部门审核,不满足要求,需要升级到4.2.8.客户将ntpd服务强制卸载,造成nodeagent无法启动,集群节点状态异常。需要保证平台正常的前提下,进行ntpd服务的版本升级。

告警信息

1、nodeagent无法启动;

2、在平台界面中无法正常监控主机。

处理过程

1、在测试环境中,按照测试方案进行ntpd服务升级的测试;

2、ntpd服务升级成功后,在生产集群进行ntpd服务升级。

3、升级过程中,如果ntpd已经被删除,再次被安装后,无法重新拉起nodeagent,需要进行调整部分参数

  /etc/sysconfig/ntpd文件修改内容为:

   # Drop root to id 'ntp:ntp' by default.
   OPTIONS="-x -l /var/log/ntp.log -u ntp:ntp -f /var/lib/ntp/drift/ntp.drift"

 修改/etc/ntp.conf权限为644


根因

1、ntpd服务版本不满足客户安全审计需求,需要升级

2、ntpd服务于nodeagent服务绑定

解决方案

一、先升级数据节点涉及命令:

   1、登录数据节点,切换到omm用户
        su - omm                        切换到omm用户
        cd /opt/huawei/Bigdata/nodeagent/bin/        进入到该目录下

   2、关闭nodeagent服务
        ./stop-agent.sh                     关闭node-agent
        ./status-agent.sh                    查看node-agent的状态
        exit                           退回到root用户

   3、通过rpm方式升级ntpd服务
        cd /home                         尽到rpm存放路径
        service ntpd stop                     停止ntpd服务
        rpm -Uvh ntp-4.2.8p1-1.el6.x86_64.rpm        升级ntpd服务
        service ntpd restart                  重启ntpd服务
        ntpd --?                         产看现在运行ntpd的版本

   4、重新启动nodeagent服务
        su - omm                            切换到omm用户
        cd /opt/huawei/Bigdata/nodeagent/bin/        进入到该目录下   
        ./start-agent.sh                     启动node-agent
        ./status-agent.sh                     查看node-agent的状态
二、登录管理节点,后升级管理节点涉及命令:

   1、登录omm用户,停止oms
        su - omm                           切换到omm用户
        cd /opt/huawei/Bigdata/om-0.0.1/sbin        进入该目录下
        ./stop-oms.sh                       关闭oms
        ./status-oms.sh                        查看oms状态

         exit                               退回到root用户

    2、通过rpm方式升级ntpd服务

        cd /home                        尽到rpm存放路径
        service ntpd stop                     停止ntpd服务
        rpm -Uvh ntp-4.2.8p1-1.el6.x86_64.rpm        升级ntpd服务
        service ntpd restart                  重启ntpd服务
        ntpd --?                          产看现在运行ntpd的版本

    3、重启oms服务
        su - omm                            切换到omm用户
        cd /opt/huawei/Bigdata/om-0.0.1/sbin        进入该目录下
        ./start-oms.sh                         开启oms
        ./status-oms.sh                       查看oms状态

建议与总结

1、要先进性数据节点ntpd的升级,在进行管理节点ntpd的升级;

2、执行部分sh脚本需要omm用户操作,root用户无法操作;

3、执行命令后,可以查看/var/log/Bigdata/nodeagent/scriptlog下的日志,查看start-agent和start_ntp日志,来判断启动失败原因。

END