所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

FusionCloud 6.3.1 故障处理 06

评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
消息通知服务故障处理 全量版

消息通知服务故障处理 全量版

现象描述

通过ManageOne运维面发现消息通知服务进程故障。

可能原因

  • 虚拟机故障。
  • zookeeper进程异常。
  • kafka进程异常。

定位思路

处理流程如图21-1所示。

图21-1 节点故障处理流程

处理步骤

  1. 使用浏览器,登录ManageOne运维面。

    • 登录地址:https://ManageOne运维面主页的访问地址:31943。例如,https://oc.type.com:31943。
    • 默认帐号:admin,默认密码:Huawei12#$。

  2. 在页面上方的菜单栏,选择“集中告警 > 当前告警”。
  3. 在告警列表中,找到待处理的告警记录,单击待处理告警行左侧的,进入“告警详情”页。
  4. 在“告警详情”页的“定位信息”中获取“主机IP”,即告警节点IP地址。
  5. 使用“PuTTY”,通过步骤 4中获取的节点管理IP地址登录故障节点。

    默认帐户:hermes,默认密码:Hermes@123。
    • 是,执行步骤 6
    • 否,说明虚拟机故障,请联系技术支持工程师协助解决

  1. 执行以下命令,检查该节点zookeeper状态是否正常。

    sh /opt/hermes/service/zookeeper/bin/zkServer.sh status

    回显包含如下类似信息:

    Mode: follower

    回显中“Mode”表示每个zookeeper节点的角色。

  2. 根据“Mode”的值,执行以下操作。

    • “Mode”为“leader”或者“follower”,表示zookeeper状态正常,请执行步骤 10
    • “Mode”为其他值,请继续执行步骤 8

  3. 执行以下命令,停止zookeeper进程。

    sh /opt/hermes/service/zookeeper/bin/stop_zookeeper.sh

  4. 执行以下命令,启动zookeeper进程。

    sh /opt/hermes/service/zookeeper/bin/start_zookeeper.sh

    说明:

    守护进程正常运行时,会自动启动zookeeper进程,无需手动执行本步骤。

  5. 在zookeeper集群的其他节点上重复执行步骤 6~步骤 7。确认所有节点的zookeeper状态是否正常。

    • 是,请执行步骤 11
    • 否,请联系技术支持工程师协助解决

  6. 执行以下命令,停止kafka进程。

    sh /opt/hermes/service/kafka/bin/stop_kafka.sh

  7. 执行以下命令,启动kafka进程。

    sh /opt/hermes/service/kafka/bin/start_kafka.sh

    说明:

    守护进程正常运行时,会自动启动kafka进程,无需手动执行本步骤。

  8. 执行以下命令,查看kafka日志。

    vi /var/log/hermes/kafka/server.log

  9. 查看日志中是否有错误提示。

    • 是,请联系技术支持工程师协助解决
    • 否,表示kafka节点服务正常,请执行步骤 15

  10. 在kafka集群的其他节点上重复执行步骤 11~步骤 14
翻译
下载文档
更新时间:2019-08-19

文档编号:EDOC1100043088

浏览量:18480

下载量:439

平均得分:
本文档适用于这些产品
相关版本
相关文档
Share
上一页 下一页