所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

FusionCloud 6.3.1 故障处理 06

评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
管理面节点常见故障处理

管理面节点常见故障处理

管理面节点故障包括虚拟机故障、网络故障,数据库故障等,有些会对业务造成影响,根据故障现象进行排查,定位,解决故障。

Gauss数据库故障

Gauss数据库故障包括主备数据不同步,主备无法切换,数据丢失。

Gauss主备数据不同步
现象描述

Gauss节点主备数据库故障,主备数据不同步。

可能原因
  • 主备通讯异常
  • 主机掉电
  • 备机升主
  • 数据丢失
定位思路

查看进程状况,进而通过命令"gs_ctl query -U gausscore -P clouddb@123"查询主备数据库状态。

处理步骤
  1. 查看是否存在管理Metastore节点故障告警。

    以数据库管理员用户(如gausscore或gaussbase)执行ping命令,确保可以ping通对端数据库IP。

    ping IP

  2. 使用PuTTY,登录newRDS-Database01节点查看ha_monitor进程。

    默认帐号:dbs,默认密码:Changeme_123

    如果没有启动,需要排查产品的监控任务是否有对ha_monitor的监控,即是否加到了系统启动项中。

    执行$(ha_install_path)/ha/module/hamon/script/start_ha_monitor.sh脚本,可以手动启动ha_monitor进程。

  3. 使用PuTTY,以root用户登录数据库服务器主机,查看“/var/log/messages”

    cat /var/log/messages

  4. 搜索系统日志,查看是否存在gaussdb关机shutdown的日志信息
  5. 通过数据库系统用户在主备数据库节点执行“gs_ctl query _U gausscore _P clouddb@123”查看SYNC_PERCENT是否为100%,如果不为100%,检查主备数据是否一致,检查网络。
  6. 修复网络后,执行"gs_ctl query -U gausscore -P clouddb@123 "查看SYSC_PERCENT是否恢复100%。如仍然不正常,请联系技术支持工程师协助解决。
Gauss主备无法切换
现象描述

主机故障,但是备机没有自动切换成主机。

可能原因
  • 查看是否存在管理db故障告警。
  • 通过“gs_ctl query -U xxx -P xxx”查看主备之间同步是否有延迟,如果延迟较大,可能导致同步失败 。
  • OMMHA故障导致没有自动切换成主机。
定位思路
  • 查看是否备机故障造成问题。
  • 查看IO和网络,是否因为IO或网络导致较大延迟。
处理步骤
  1. 使用PuTTY,登录newRDS-Database01节点。

    默认帐号:dbs,默认密码:Changeme_123

  2. 检查状态,如果备机故障,会无法倒换。如:备机已经宕机、备机的进程已经停止。
  3. 通过“iostat -x N”查看磁盘IO。

    需要计算吞吐量和IOPS,以确定是否达到IO瓶颈。通过专门工具查看网络状态,如nmon,确定网络流量是否达到网络瓶颈。

翻译
下载文档
更新时间:2019-08-19

文档编号:EDOC1100043088

浏览量:18095

下载量:438

平均得分:
本文档适用于这些产品
相关文档
相关版本
Share
上一页 下一页