所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

FusionCloud 6.3.1 故障处理 06

评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
RTS故障处理

RTS故障处理

现象描述

通过ManageOne运维面发现RTS服务节点进程异常,需恢复。

可能原因

  • 虚拟机故障。
  • RTS服务进程异常。
  • 数据库异常。

定位思路

处理流程如图24-16所示。

图24-16 节点故障处理流程

处理步骤

  1. 根据ManageOne运维面告警邮件中的“IP地址”确定发生异常的节点IP地址。
  2. 查看该异常节点是否可以通过PuTTY正常登录。

    默认帐户:rts,默认密码:IaaS@SERVICE-CLOUD8!。
    • 是,执行步骤 3
    • 否,说明虚拟机故障,请联系技术支持工程师协助解决

  3. 执行以下命令,防止“PuTTY”超时退出。

    TMOUT=0

  4. 执行下面命令,检查heat进程是否存在,heat进程包括heat-api、heat-api-cfn、heat-engine、groupwatch等。

    ps -ef | grep heat

    • 是,执行步骤 5
    • 否,执行步骤 9,尝试重启进程。如果重启失败,执行步骤 5

      回显如下所示时,表示heat进程存在。

      [root@RTS-SERVICE01 rts]# ps -ef | grep heat
      root     11129  4204  0 22:59 pts/0    00:00:00 grep --color=auto heat
      opensta+ 26332     1  0 Apr04 ?        00:00:01 /usr/bin/python2.7 /usr/bin/heat-api --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/heat-api
      opensta+ 26348     1  0 Apr04 ?        00:00:01 /usr/bin/python2.7 /usr/bin/heat-api-cfn --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/heat-api-cfn
      opensta+ 26364     1  0 Apr04 ?        00:00:01 /usr/bin/python2.7 /usr/bin/groupwatch --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/groupwatch
      opensta+ 26365 26332  2 Apr04 ?        03:24:33 /usr/bin/python2.7 /usr/bin/heat-api --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/heat-api
      opensta+ 26366 26332  2 Apr04 ?        03:24:57 /usr/bin/python2.7 /usr/bin/heat-api --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/heat-api
      opensta+ 26367 26332  2 Apr04 ?        03:25:14 /usr/bin/python2.7 /usr/bin/heat-api --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/heat-api
      opensta+ 26376 26348  0 Apr04 ?        00:00:34 /usr/bin/python2.7 /usr/bin/heat-api-cfn --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/heat-api-cfn
      opensta+ 26377 26348  0 Apr04 ?        00:00:34 /usr/bin/python2.7 /usr/bin/heat-api-cfn --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/heat-api-cfn
      opensta+ 26378 26348  0 Apr04 ?        00:00:33 /usr/bin/python2.7 /usr/bin/heat-api-cfn --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/heat-api-cfn
      opensta+ 26380     1  1 Apr04 ?        02:06:45 /usr/bin/python2.7 /usr/bin/heat-engine --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/heat-engine
      opensta+ 26389 26364  0 Apr04 ?        00:00:34 /usr/bin/python2.7 /usr/bin/groupwatch --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/groupwatch
      opensta+ 26390 26364  0 Apr04 ?        00:00:34 /usr/bin/python2.7 /usr/bin/groupwatch --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/groupwatch
      opensta+ 26392 26364  0 Apr04 ?        00:00:34 /usr/bin/python2.7 /usr/bin/groupwatch --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/groupwatch
      opensta+ 26469 26380  2 Apr04 ?        03:22:24 /usr/bin/python2.7 /usr/bin/heat-engine --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/heat-engine
      opensta+ 26470 26380  2 Apr04 ?        03:22:59 /usr/bin/python2.7 /usr/bin/heat-engine --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/heat-engine
      opensta+ 26471 26380  2 Apr04 ?        03:21:43 /usr/bin/python2.7 /usr/bin/heat-engine --config-file /etc/heat/heat.conf --log-dir /var/log/RTS/heat-engine

  5. 通过命令vi /var/log/RTS/heat-engine/heat-engine.log查看RTS节点日志,确保没有出现异常日志(Exception)。

    若出现(psycopg2.OperationalError) could not connect to server错误,表示连接数据库异常。需要先排查数据库是否正常运行。

  6. 使用“PuTTY”,以“rts”用户登录RTS的DB节点。

    默认帐户:rts,默认密码:IaaS@SERVICE-CLOUD8!。

  7. 执行以下命令,防止“PuTTY”超时退出。

    TMOUT=0

  8. 执行sudo su - root切换到root下,并执行命令service had query,查询数据库状态是否为normal。

    • 是,执行步骤 9
    • 否,请联系技术支持工程师协助解决
    [root@I-RTS-DB01 rts]# service had query
    NODE                         ROLE           PHASE           RESS            VER             START
    I-RTS-DB01(I-RTS-DB01)       active         Actived         normal          V100R001C01     2018-03-23 08:18:00
    I-RTS-DB02(I-RTS-DB02)       standby        Deactived       normal          V100R001C01     2018-03-23 08:18:01
    
    --------------------------------------------------------------------------------------------------------
                                 ID    RES                      STAT            RET             TYPE
    I-RTS-DB01(I-RTS-DB01):      1     exfloatip                Normal          Normal          Single_active
                                 2     gaussDB                  Normal          Active_normal   Active_standby
    
    I-RTS-DB02(I-RTS-DB02):      1     exfloatip                Normal          Abnormal        Single_active
                                 2     gaussDB                  Normal          Standby_normal  Active_standby

  9. 排除上面的故障后,在RTS节点执行以下命令,启动RTS进程。

    sh /etc/heat/heat/start_heat_service.sh

  10. 如果完成以上步骤操作之后,RTS仍然无法正常提供服务,请联系技术支持工程师协助解决
翻译
下载文档
更新时间:2019-08-19

文档编号:EDOC1100043088

浏览量:19433

下载量:448

平均得分:
本文档适用于这些产品
相关版本
相关文档
Share
上一页 下一页