所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

FusionCloud 6.3.1 故障处理 06

评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
pod 启动失败

pod 启动失败

现象描述

pod启动错误——状态处于CrashLookBack、ExecuteCommandFailed、ErrPackagePull

可能原因

  • 应用设置了健康检查规则,健康检查失败导致pod不断重启(CrashLookBack)。
  • 虚机应用启动时执行脚本有问题(ExecuteCommandFailed)。
  • 镜像、软件包路径有问题(ErrPackagePull)。

处理方法

  1. CrashLookBack问题排查。

    1. 使用PuTTY,登录om_core1_ip节点。

      默认帐号:paas,默认密码:QAZ2wsx@123!

    2. 执行如下命令确认容器是处于unhealthy状态。

      kubectl describe pod {podname} -n {namespace}

    3. 执行如下命令检查业务健康检查脚本执行情况,由于健康检查脚本是由业务模块设置的,因此没有具体的排错措施。

      如果排查不出问题,请联系技术支持工程师协助解决。

      kubectl get pod {podname} -n {namespace} -oyaml

  2. ExecuteCommandFailed问题排查。

    执行如下命令:

    kubectl describe pod {podname} -n {namespace}

    执行如下命令,获取pod所在节点IP。

    kubectl get pod podname -n namespace -owide

    返回结果:

    以paas用户登录节点,并切换到pod所在目录,上图红框中的路径,/var/lib/kubelet/pods/9eb4b065-3a3f-11e7-ba5b-286ed48926f2/processes/{进程名}/log/

    一般会有如下日志文件,查看*.stderr的日志信息,就可以找到执行失败的原因

  3. ErrPackagePull问题排查。

    执行如下命令,查看到pod处于ErrPackagePull状态。

    kubectl get pod {podname} -n {namespace}

    执行如下命令,能显示具体的软件包/镜像路径和版本号。

    kubectl describe pod {podname} -n {namespace}

    1. 对比确认软件仓库/镜像仓库中是否已存在此软件/镜像,如果不存在,请确认上传对应版本的软件包/镜像。
    2. 在节点上curl -k 10.120.193.73:2567(上图红框中为软件仓库的地址)看网络是否能通。如果不能通,先排查完毕网络问题。
    3. 如果仍不能解决问题,请联系技术支持工程师协助解决。

翻译
下载文档
更新时间:2019-08-19

文档编号:EDOC1100043088

浏览量:19173

下载量:447

平均得分:
本文档适用于这些产品
相关版本
相关文档
Share
上一页 下一页