所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

FusionCloud 6.3.1 故障处理 06

评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
维护类

维护类

NTP服务器与Manager或Server时间差异过大

现象描述

NTP服务器与Manager或Server时间差异过大,eBackup GUI上出现告警提示。

可能原因

当NTP服务器与备Manager或Server之间由于网络断开或NTP服务器时间修改后,会导致NTP服务器与Manager或Server之间的时间出现差异,当差异量过大时(超过1分钟)eBackup上会出现告警提示。

Manager或Server会一直与NTP服务器进行对时,当二者时间差异过大时,Manager或Server在时间同步后,会发生较大的跳变,可能导致计划任务的执行时间延迟或提前。

说明:

如果用户评估影响较小,可以不做处理。否则,请执行以下操作解决该问题。完成以下操作后,eBackup服务会重启,将导致几秒钟的时间不能对外提供服务。

处理步骤
  1. 使用浏览器,登录Manager或Server的GUI。

    登录地址:https://Workflow-Management-Float-IP字段对应的IP地址datamover_management_float_ip字段对应的IP地址:8088

    默认帐号:admin,默认密码为:使用FCD安装为Cloud12#$,手工方式安装为PXU9@ctuNov17!

  2. 在导航栏上选择“ > 系统时间”。
  3. 在“NTP服务器地址”输入框中,输入本地IP地址“127.0.0.1”,单击“确定”。
  4. 在弹出的“警告”框中,单击“确定”。
  5. 退出并重新登录Manager或Server的GUI。
  6. 在导航栏上选择“ > 系统时间”。
  7. 在“NTP服务器地址”输入框中,输入NTP服务器的IP地址,单击“确定”。
  8. 在弹出的“警告”框中,单击“确定”。

Proxy的NTP服务异常,时间与Server不同步,且没有告警产生

现象描述

Proxy时间与Server时间不同步,且没有告警产生。

可能原因

“/etc/ntp.conf”文件中没有以“server”开头的行,导致更新NTP服务器时失败。

处理步骤
  1. 使用PuTTY,以管理IP地址登录存在NTP异常的Proxy。

    默认帐户:hcp,默认密码:PXU9@ctuNov17!

  2. 执行su root命令,输入root帐号密码,切换至root帐号。

    root帐号的默认密码为Cloud12#$

  3. 执行TMOUT=0命令,防止系统超时退出。

    说明:

    执行该命令后,当前系统在无操作时会保持运行状态,存在安全风险,为了确保系统安全,请在完成相应操作后,执行exit退出当前系统。

  4. 执行cat /etc/ntp.conf | grep "^server*"命令,查询是否有回显信息。

    • 是,请联系技术支持。
    • 否,执行步骤 5

  5. 使用浏览器,登录Server的GUI。

    登录地址:https://datamover_management_float_ip字段对应的IP地址:8088

    默认帐号:admin,默认密码为:使用FCD安装为Cloud12#$,手工方式安装为PXU9@ctuNov17!

  6. 在导航栏上选择“ > 服务器”。
  7. 查询备份服务器的内部通信平面IP地址。

    • HA场景下:

      查找角色为“备份服务器(主)”的内部通信平面IP地址。

    • 非HA场景下:

      查找角色为“备份服务器”的内部通信平面IP地址。

  8. 在异常的Proxy上执行echo "server IP地址 prefer minpoll 4 maxpoll 5" >> /etc/ntp.conf命令,添加NTP服务器。

    其中,IP地址步骤 7中查询到的IP地址。

  9. 依次执行以下命令,使配置生效。

    cd /etc/init.d

    hwclock --systohc > /dev/null 2>&1

    service ntp restart > /dev/null 2>&1

    chkconfig ntp 3 > /dev/null 2>&1

    chkconfig ntp 5 > /dev/null 2>&1

    chkconfig ntp on > /dev/null 2>&1

    cd -

  10. 执行service ntp status命令,确认返回值中是否存在服务器的内部通信IP。

    • 是:问题已解决。

      如图所示:

    • 否:请联系技术支持处理。

执行跨AZ恢复操作后,eBackup的备份、恢复或者删除任务出现失败的现象

现象描述

执行跨AZ恢复操作后,如果eBackup环境出现备份、恢复或者删除任务失败的情况,查看对应的微服务的日志,日志中存在有database disk image is malformed的错误信息。

可能原因

eBackup执行跨AZ恢复任务时,多个任务同时操作ChainDB.db文件,导致文件被损坏。

处理步骤
  1. 使用PuTTY,登录Server角色所在的节点

    登录地址:可从登录Server的GUI地址中获取其管理IP地址。

    默认帐户:hcp,默认密码:PXU9@ctuNov17!

  2. 执行su root命令,输入root帐号密码,切换至root帐号。

    root帐号的默认密码为Cloud12#$

  3. 执行TMOUT=0命令,防止系统超时退出。

    说明:

    执行该命令后,当前系统在无操作时会保持运行状态,存在安全风险,为了确保系统安全,请在完成相应操作后,执行exit退出当前系统。

  4. 执行cd /opt/huawei-data-protection/ebackup/sbin命令,进入“uds_plug-in”脚本所在目录。
  5. 依次执行以下命令,设置环境变量。

    export LD_LIBRARY_PATH=/opt/huawei-data-protection/ebackup/libs

    export ODBCINI=/opt/huawei-data-protection/ebackup/conf/odbc.ini

    export ODBCSYSINI=/opt/huawei-data-protection/ebackup/conf

  6. 执行./uds_plug-in DownloadChainDB <destination_file_absolute_path> <source_volume_id> [backup_storage_type]命令,下载ChainDB.db文件。

    表17-3 参数说明

    参数名称

    参数说明

    destination_file_absolute_path

    下载ChainDB.db文件时,本地保存路径(下载时使用,必选参数)。

    source_volume_id

    备份、恢复或删除失败的卷ID(必选参数)。

    backup_storage_type

    备份存储类型(可选参数,默认为远端存储)。

    取值范围:

    • remote,表示远端存储。
    • local,表示本地存储。

    示例:

    • S3类型的备份存储:
      • ./uds_plug-in DownloadChainDB /home/hcp b2aabdd1-be92-427f-9beb-64df4db010fe
      • ./uds_plug-in DownloadChainDB /home/hcp b2aabdd1-be92-427f-9beb-64df4db010fe remote

        以上两个示例命令均可。

    • NFS类型的备份存储:

      ./uds_plug-in DownloadChainDB /home/hcp 59a9f2cd-9ac9-4639-bf5b-143ca6df0460 local

    操作过程中,请根据界面提示输入相关信息。

    • 当回显如下信息时,请输入S3桶的Access Key ID。
      Please enter the Access Key:
    • 当回显如下信息时,请输入S3桶的Secret Access Key。
      Please enter the Secret Access Key:

    当回显如下信息时,则表示下载ChainDB.db文件成功。

    Download file success.

    相关参数说明:

  7. 执行sqlite3 ChainDB.db ".dump" | sqlite3 tmp.db命令,修复ChainDB.db文件。
  8. 执行pragma integrity_check;命令,检查ChainDB.db文件的完整性。

    当出现如下图所示时,则表示修复完成。

    修复完成后,把“tmp.db”更名为“ChainDB.db”。

  9. 执行./uds_plug-in UploadChainDB <source_absolute_path> <source_volume_id> [backup_storage_type(remote:remote backup, local:local backup. default: remote)]命令,上传修复后的ChainDB.db文件。
  10. 重新执行失败了的备份、恢复或删除任务。检查任务是否执行成功:

    • 是,处理完毕。
    • 否,联系技术支持。

修改OpenStack配置信息错误后,出现再次填写正确参数,显示配置不成功的现象

现象描述

第一次成功配置OpenStack信息后,第二次填写错误的配置信息,配置失败。第三次再次配置正确信息时,显示配置不成功。

第三次配置失败后,刷新页面。无论之前配置的信息正确与否,界面都显示为第一次的配置信息。

可能原因

如果第三次配置信息与第一次配置信息相同,界面默认为已经进行了配置,则不再做参数下发的操作,导致配置不成功。

处理步骤
  1. 如果能进入后台数据库,则参考以下步骤进行处理。

    1. 使用PuTTY,以“Workflow-PublicService-IP0”字段对应的IP地址登录workflow-eBackup01节点(Manager角色所在的节点)。

      在CSHA或管理面跨AZ高可用场景下,节点的名称为“workflow-eBackup”

      默认帐户:hcp,默认密码:PXU9@ctuNov17!

    2. 执行su root命令,输入root帐号密码,切换至root帐号。

      root帐号的默认密码为Cloud12#$

    3. 执行TMOUT=0命令,防止系统超时退出。
      说明:

      执行该命令后,当前系统在无操作时会保持运行状态,存在安全风险,为了确保系统安全,请在完成相应操作后,执行exit退出当前系统。

    4. 执行cd /opt/huawei-data-protection/ebackup/db/bin命令,进入“/opt/huawei-data-protection/ebackup/db/bin”目录。
    5. 执行export LD_LIBRARY_PATH=/opt/huawei-data-protection/ebackup/db/lib/命令,导入环境变量。
    6. 执行./gsql -d WFVMWAREDB -U gaussdb -p 6432 -h 内部通信平面浮动IP地址命令,进入vmware数据库。

      示例:

      ./gsql -d WFVMWAREDB -U gaussdb -p 6432 -h 10.133.192.145

    7. 执行delete from openstackconfig;命令,删除vmware数据库中openstackconfig表的内容。

      如下图所示:

    8. 使用浏览器,登录Manager的GUI。

      登录地址:https://Workflow-Management-Float-IP字段对应的IP地址:8088

      默认帐号:admin,默认密码为:使用FCD安装为Cloud12#$,手工方式安装为PXU9@ctuNov17!

    9. 在导航栏上选择“ > 配置 > OpenStack设置”重新配置OpenStack信息。

  2. 如果存在多个认证服务器,则参考以下步骤进行处理。

    1. 使用浏览器,登录Manager的GUI。

      登录地址:https://Workflow-Management-Float-IP字段对应的IP地址:8088

      默认帐号:admin,默认密码为:使用FCD安装为Cloud12#$,手工方式安装为PXU9@ctuNov17!

    2. 在导航栏上选择“设置 > 配置 > OpenStack设置”。
    3. 对与第一次配置OpenStack信息时使用的认证服务器不同的认证服务器进行配置。
    4. 重新登录Manager的GUI界面,选择“ > 配置 > OpenStack设置”配置OpenStack信息。

  3. 如果状态未恢复正常,请联系技术支持处理。

Proxy节点移除后微服务停止告警无法清除

现象描述

将Proxy节点移除后,再在ebackup管理界面上注销移除的Proxy节点,上报了备份、拷贝等多个微服务停止的告警,手工清除后仍然会继续上报。

可能原因

由于Server是通过心跳检测机制来对微服务的状态进行检测,如果心跳检测超时,则会上报微服务停止的告警,当Proxy节点移除后,Server检测不到Proxy节点的微服务状态,所以一直上报告警。

处理步骤
  1. 使用PuTTY,登录Server角色所在的节点

    登录地址:可从登录Server的GUI地址中获取其管理IP地址。

    默认帐户:hcp,默认密码:PXU9@ctuNov17!

  2. 执行su root命令,输入root帐号密码,切换至root帐号。

    root帐号的默认密码为Cloud12#$

  3. 执行TMOUT=0命令,防止“PuTTY”超时退出。

    说明:

    执行该命令后,当前系统在无操作时会保持运行状态,存在安全风险,为了确保系统安全,请在完成相应操作后,执行exit退出当前系统。

  4. 执行sed -i "/server 移除节点内部心跳IP地址:.*down/d" /opt/huawei-data-protection/ebackup/microservice/ebk_lb_*/bin/nginx/conf/nginx.conf命令,清除注销节点的配置信息。

    示例:

    sed -i "/server 192.168.0.1:.*down/d" /opt/huawei-data-protection/ebackup/microservice/ebk_lb_*/bin/nginx/conf/nginx.conf

  5. 执行以下命令重启governance微服务。

    cd /opt/huawei-data-protection/ebackup/microservice/ebk_governance_*/script

    source ebackup_env.sh

    sh ebackup_stop.sh

  6. 重新登录Server的GUI。
  7. 单击“监控 > 告警”,选择需要清除的微服务停止的告警信息,单击“清除”,弹出确认对话框,再单击“确认”。
翻译
下载文档
更新时间:2019-08-19

文档编号:EDOC1100043088

浏览量:17953

下载量:438

平均得分:
本文档适用于这些产品
相关文档
相关版本
Share
上一页 下一页