所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

FusionCloud 6.3.1 故障处理 06

评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
文件存储故障

文件存储故障

GaussDB主备异常

现象描述

OceanStor DJ节点界面无法登录,业务异常。

可能原因
  • 停止所有节点的服务、意外掉电后,等待超过10分钟,主GaussDB服务无法正常启动。
  • 系统被修改后的时间差超过10分钟再启动各节点服务,主GaussDB服务无法正常启动。
处理步骤
  1. 使用“PuTTY”,通过OceanStor DJ节点的管理平面IP地址,登录到SFS-DJ01、SFS-DJ02或SFS-DJ03节点。

    默认账号:“djmanager”,默认密码:“CloudService@123!”

    SFS_DJ01、SFS_DJ02或SFSDJ_03的管理平面IP地址,请在FCD部署工具配置部署参数后导出的参数信息汇总文件《xxx_export_all.xlsm》的“FCD生成的LLD”页签搜索“SFS_DJ01”“SFS_DJ02”“SFSDJ_03”获得。

  2. 执行以下命令并输入root密码“Cloud12#$”,切换到root用户。

    su - root

  3. 执行以下命令,防止会话超时退出。

    TMOUT=0

  4. 执行show_service --service omm-ha命令,查看omm-ha组件所在节点。

    回显信息如下所示。

    [root@localhost ~]# show_service --service omm-ha 
    +-------------+---------+---------+------------+ 
    | instanceid  | service | status  | runsonhost | 
    +-------------+---------+---------+------------+ 
    | DJ03_omm-ha | omm-ha  | active  | DJ03       | 
    | DJ01_omm-ha | omm-ha  | standby | DJ01       | 
    +-------------+---------+---------+------------+     

  5. 分别登录omm-ha组件所在的两个节点,执行bash /usr/local/bin/ha/ha/config_script/sync_monitor.sh get_status命令,检查GaussDB服务在线时间。

    回显信息如下所示。

    [root@localhost ~]# bash /usr/local/bin/ha/ha/config_script/sync_monitor.sh get_status 
    DB last online role : Standby 
    DB last online time : 2018-03-21 19:14:25.      

  6. 步骤 5中的在线时间与当前时间比较。

    • 如果时间差超过10分钟,请执行步骤 7
    • 如果时间差未超过10分钟,请执行步骤 9

  7. 在omm-ha组件所在的两个节点上分别执行bash /usr/local/bin/ha/ha/config_script/sync_monitor.sh get_status命令,根据回显信息确认主GaussDB服务所在节点。

    • 如果两个节点的角色是“Primary”“Standby”,则角色为“Primary”的节点为主GaussDB服务所在节点。
    • 如果两个节点的角色都是“Primary”,则比较在线时间,在线时间与当前时间最接近的节点为主GaussDB服务所在节点。

  8. 在主GaussDB服务所在节点上执行bash /usr/local/bin/ha/ha/config_script/sync_monitor.sh reset_status命令。
  9. 等待2分钟后登录OceanStor DJ节点,检查是否恢复正常。

    • 是 => 处理结束。
    • 否 => 请联系技术支持工程师协助解决。

卸载OceanStor DJ失败

现象描述

卸载OceanStor DJ失败。

可能原因

已存在卸载清理OceanStor DJ的进程,无法重新执行卸载。

处理步骤
  1. 使用“PuTTY”,通过OceanStor DJ节点的管理平面IP地址,登录到SFS-DJ01、SFS-DJ02或SFS-DJ03节点。

    默认账号:“djmanager”,默认密码:“CloudService@123!”

    SFS_DJ01、SFS_DJ02或SFSDJ_03的管理平面IP地址,请在FCD部署工具配置部署参数后导出的参数信息汇总文件《xxx_export_all.xlsm》的“FCD生成的LLD”页签搜索“SFS_DJ01”“SFS_DJ02”“SFSDJ_03”获得。

  2. 执行以下命令并输入root密码“Cloud12#$”,切换到root用户。

    su - root

  3. 执行以下命令,防止会话超时退出。

    TMOUT=0

  4. 执行docker ps -a命令,查看docker容器状态。检查卸载失败组件对应的容器是否为“Exited”状态。

    [root@DJ182 inst]# docker ps -a 
    CONTAINER ID        IMAGE                        COMMAND                  CREATED             STATUS                        PORTS               NAMES
    a5589b3df054        dashboard:1.2.10.2           "bash /etc/dashboard/"   33 hours ago        Exited (137) 20 seconds ago                       dashboard
    1e5e7e08f6c0        oms-controller:1.2.10.2      "/bin/bash /usr/bin/i"   33 hours ago        Up 33 hours                                       oms-controller
    672d9e966363        hermes:1.2.10.2              "/bin/bash -c 'sh /et"   33 hours ago        Up 33 hours                                       hermes
    3b2e1646cbdf        heat:1.2.10.2                "bash -c 'sh /install"   33 hours ago        Up 33 hours                                       heat-engine
    1e44b9b55269        heat:1.2.10.2                "bash -c 'sh /install"   33 hours ago        Up 33 hours                                       heat-api
    29027f6ae2cc        filemeter-service:1.2.10.1   "/bin/bash /usr/bin/S"   33 hours ago        Up 33 hours                                       filemeter-service
    f2bb90699e6d        filemeter-api:1.2.10.1       "/bin/bash /usr/bin/S"   33 hours ago        Up 33 hours                                       filemeter-api
    662653dcdda7        authkeepmgt:1.2.10.2         "/bin/bash -c /usr/bi"   33 hours ago        Up 31 hours                                       authkeepmgt
    a3bf03de8c2f        oms-agent:1.2.10.2           "/bin/bash /usr/bin/i"   33 hours ago        Up 33 hours                                       oms-agent
    ac75776db2cd        manila-scheduler:1.2.10.0    "/bin/bash /usr/bin/S"   33 hours ago        Up 33 hours                                       manila-scheduler
    fd2b42f8d015        manila-api:1.2.10.0          "/bin/bash /usr/bin/S"   33 hours ago        Up 33 hours                                       manila-api_tenant
    0c43cf729dd9        manila-api:1.2.10.0          "/bin/bash /usr/bin/S"   33 hours ago        Up 33 hours                                       manila-api_admin
    fe0beebc452b        oms-api:1.2.10.2             "/bin/bash /usr/bin/i"   33 hours ago        Up 33 hours                                       oms-api
    30cda53ce979        certms:1.2.10.2              "/bin/bash -c /usr/bi"   33 hours ago        Up 31 hours                                       certms
    9bf80fcbca10        rabbitmq:1.2.10.2            "bash /usr/local/lib/"   33 hours ago        Up 33 hours                                       rabbitmq
    681eb9754aa0        keystone:1.2.10.2            "/bin/bash keystone_r"   33 hours ago        Up 33 hours                                       keystone
    1e1805ce94c4        fms:1.2.10.2                 "bash /opt/huawei/dj/"   33 hours ago        Up 33 hours                                       fms
    f37ac70e39e9        cms:1.2.10.2                 "bash /etc/cms/cms-se"   33 hours ago        Up 33 hours                                       cms
    27aa50fe68bf        zookeeper:1.2.10.2           "/bin/bash -c 'bash /"   33 hours ago        Up 33 hours                                       zookeeper
    1b2ca1fff7c8        gaussdb:1.2.10.2             "bash /home/start_gau"   33 hours ago        Up 33 hours                                       gaussdb

  5. 执行ps -ef | grep dashboardControl命令,检查dashboard是否存在未清理的卸载进程。

    • 当界面显示“dashboardControl -S STOP”时,确认此进程的“进程ID”,如图14-3所示,进程ID为“10636”,执行步骤 6
      图14-3 dashboardControl -S STOP进程屏显
    • 如果不存在,请联系技术支持工程师协助解决。

  6. 执行kill -9 进程ID命令,强制终止“dashboardControl -S STOP”进程。
  7. 执行ps -ef | grep dashboardControl命令,检查“dashboardControl -S STOP”进程是否仍然存在。

    • 如果存在,请联系技术支持工程师协助解决。
    • 如果不存在,执行步骤 8

  8. 请参见《存储即服务解决方案 V1R3C00RC1 弹性文件服务软件安装指南》“卸载OceanStor DJ”,重新卸载OceanStor DJ

ManageOne运营面出现“对于已经删除的资源不允许执行任何操作”

现象描述

执行恢复GuassDB数据后,在ManageOne运营面对文件系统执行操作,出现“对于已经删除的资源不允许执行任何操作”的提示。

可能原因

在备份时间点后,用户执行了彻底删除文件系统的操作,导致数据库备份恢复后仍存在该文件系统,但无法进行任何操作。

处理步骤
  1. 使用“PuTTY”,通过OceanStor DJ节点的管理平面IP地址,登录到SFS-DJ01、SFS-DJ02或SFS-DJ03节点。

    默认账号:“djmanager”,默认密码:“CloudService@123!”

    SFS_DJ01、SFS_DJ02或SFSDJ_03的管理平面IP地址,请在FCD部署工具配置部署参数后导出的参数信息汇总文件《xxx_export_all.xlsm》的“FCD生成的LLD”页签搜索“SFS_DJ01”“SFS_DJ02”“SFSDJ_03”获得。

  2. 执行以下命令并输入root密码“Cloud12#$”,切换到root用户。

    su - root

  3. 执行以下命令,防止会话超时退出。

    TMOUT=0

  4. 执行docker exec -it -u root manila-api_tenant bash命令进入manila容器。
  5. 执行vi /home/env.sh观察文件中是否已有环境变量,环境变量如下:

    • 如果有以下环境变量,执行步骤 6
      #!/bin/bash
      FULL_PATH=`readlink -f ${BASH_SOURCE}`
      CWD=`dirname ${FULL_PATH}`
      IP_ADDR=$(get_info.py --manage_float_ip)
      if [[ ${IP_ADDR} == *:* ]];then
              IP_ADDR="["${IP_ADDR}"]"
          fi
      export OS_PASSWORD=CloudService@123!
      export OS_AUTH_URL=https://${IP_ADDR}:35357/identity/v3
      export OS_USERNAME=manila
      export OS_TENANT_NAME=service
      export OS_PROJECT_DOMAIN_NAME=Default
      export OS_USER_DOMAIN_NAME=Default
      export OS_IDENTITY_API_VERSION=3
      export OS_SERVICE_ENDPOINT=https://${IP_ADDR}:35357/identity-admin/v3
      export OS_SERVICE_TOKEN=$(curl -g -k -i -X POST https://${IP_ADDR}:35357/identity-admin/v3/auth/tokens -H "Content-Type:application/json" -d '{"auth": {"identity": {"methods":[ "password" ],"password": {"user": {"name": "manila","domain": { "name": "Default" },"password": "CloudService@123!" } } }, "scope": {"project": { "name":"service", "domain": {"name":"Default" }}}}}' |grep "X-Subject-Token"|awk -F':' '{print $2}')
      export OS_REGION_NAME="az1.dc1"
      export OS_ENDPOINT_TYPE=internalURL
      export MANILA_ENDPOINT_TYPE=adminURL
      export MANILACLIENT_INSECURE=True
      说明:

      password“manila”的密码,默认为“CloudService@123!”

    • 如果没有,将以上环境变量的内容复制粘贴进文件后,按“wq!”保存退出,执行步骤 6
      说明:

      “OS_SERVICE_TOKEN”值仅为一条信息,因PDF下会自动增加换行,复制粘贴后请手动删除换行符。

  6. 执行source /home/env.sh命令导入环境变量。
  7. 登录ManageOne运维面,查看租户操作日志,记录备份时间后执行过彻底删除的文件系统id。
  8. 执行manila force-delete <share_id>命令删除文件共享。

    其中,<share_id>步骤 7中记录的文件系统id替换。

  9. 执行rm /home/env.sh命令删除环境变量文件。
翻译
下载文档
更新时间:2019-08-19

文档编号:EDOC1100043088

浏览量:22081

下载量:452

平均得分:
本文档适用于这些产品

相关版本

相关文档

Share
上一页 下一页