所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

FusionCloud 6.3.1 故障处理 06

评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
云服务管理面故障诊断

云服务管理面故障诊断

本章节通过查看操作日志、集中告警、收集日志等,诊断云服务发放失败和云服务实例操作失败问题。

现象描述

  • 云服务发放失败,如创建弹性云服务器、云硬盘、创建虚拟网络失败等。
  • 云服务实例操作失败,如挂载云硬盘失败、挂载虚拟网卡失败等。

可能原因

  • 资源池中计算、存储、网络资源不足。
  • 弹性云服务器、云硬盘等配置错误。

诊断流程

前提条件

  • ManageOne完成资源池接入。

处理步骤

  1. 使用浏览器,登录ManageOne运维面。

    登录地址:https://ManageOne运维面主页的访问地址:31943。例如,https://oc.type.com:31943。

    默认帐号:admin,默认密码:Huawei12#$。

  2. 在主菜单中单击,进入“运维地图”。
  3. 单击“云服务管理面故障诊断”,进入诊断页面。

    说明:

    如果不存在“云服务管理面故障诊断”入口,请参见《FusionCloud 6.3.1 运维指南》中的“运维界面准备”设置诊断任务。

排查操作日志

  1. 在左侧导航栏中单击“操作日志”,进入操作日志界面。
  2. 输入“操作日志ID”,查询本次失败的任务日志。操作日志ID请参见操作日志ID的获取方法进行获取。

    如果查询结果为空,请联系技术支持工程师协助解决。

  3. 在存在故障的日志行,单击,查看日志详情。
  4. 单击当前处理日志行右侧的调用链链接,进入本次拓扑详情页面,通过该页面可以查看组件的调用关系,确定异常组件,实现问题定界。相关说明如图3-1所示。

    图3-1 拓扑信息
    表3-1 拓扑信息

    参数

    展示说明

    相关操作

    正常

    绿色光圈的节点表示正常的节点,代表无错误的组件。

    单击红色光圈节点弹出对应组件的错误数据,单击绿色光圈节点弹出对应组件的IP地址。

    异常

    红色光圈的节点表示异常的节点,代表有错误的组件。

    首节点

    灰色背景的节点表示首节点,代表调用的起始组件。

  5. 单击任意数据,可跳转到本次Trace详情页面,相关任务和对应操作如图3-2所示。

    图3-2 Trace详情
    表3-2 Trace详情

    展示名称

    相关说明

    生成时间

    服务调用的起始时间。

    耗时

    整个调用耗费的时间。

    响应

    服务入口处调用返回的http响应码。

    服务名称

    异常日志的服务名称。

    操作/Url

    服务打点的入口处Url。

    RequestId

    单击“RequestId”,查看关联的云服务日志和Trace原始数据。

    主机IP

    故障服务节点的IP地址。

    状态

    详细信息中“状态”列为表示日志正常,为表示日志异常。

    时间轴

    业务执行时请求响应的时长。

  6. 在“异常汇总”区域,单击异常记录的“服务名称”,弹出“详情”窗口,如图3-3所示。

    图3-3 详情
    说明:

    一条Trace数据由若干Span构成,每个Span又挂接若干子Span,通过调用上下文(TraceID、ParentID、SpanID),串连成一棵调用树。

    • TraceID是一次业务调用产生的Trace信息的唯一标识。
    • SpanID至少保证相同TraceID内唯一。
    • ParentID是Span的父ID。

  7. 单击“异常分析”页签可以查看并分析本次调用及调用异常的详细信息,如图3-4所示。

    “RequestId”和“Job Id”是关联业务日志的ID,单击“RequestId”的链接可以查看相关日志详情。
    • RequestId关联FusionSphere OpenStack组件的日志。
    • Job Id关联云服务的业务日志。
      图3-4 异常分析

  8. 在当前日志信息不足以支撑定位的情况下,执行步骤 12~步骤 13下载日志并排查分析。
  9. 单击“日志收集”页签,进入日志收集页面,如下图所示:

  10. 单击“日志收集”,下发日志收集任务 ,等任务状态为100%之后,单击“下载”进行下载日志。

  11. 根据下载的日志进行故障分析并处理故障,如果无法找出故障原因,可以将日志回传给研发技术人员进行定位分析。
  12. 故障是否已解决。

    • 是,处理完毕。
    • 否,执行步骤 16

排查告警信息

  1. 在“云服务管理面故障诊断”页面,单击左侧导航栏中“集中告警”,进入集中告警页面。
  2. 排查是否存在相关未恢复的告警,根据告警在线帮助处理告警。
  3. 故障是否解决。

    • 是,处理完毕。
    • 否,请联系技术支持工程师协助解决,并提供已经收集的Trace日志。执行步骤 19

  4. 技术支持人员通过分析已经提供的Trace日志,制定故障处理方案。

    根据技术人员的方案是否可以解决故障。
    • 是,处理完毕。
    • 否,执行步骤 20

收集日志信息

  1. 单击左侧导航栏“日志收集”,进入日志收集页面。

    根据技术支持给出的日志收集方案进行日志收集。

    说明:

  2. 是否可以解决故障。

    • 是,处理完毕。
    • 否,请联系技术支持工程师协助解决。

翻译
下载文档
更新时间:2019-08-19

文档编号:EDOC1100043088

浏览量:18450

下载量:439

平均得分:
本文档适用于这些产品
相关版本
相关文档
Share
上一页 下一页