所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

FusionCloud 6.3.1 故障处理 06

评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
检查数据库实例复制状态为异常

检查数据库实例复制状态为异常

现象描述

数据库主节点实例正常,数据库备节点实例复制状态为异常。

可能原因

  • 服务器网络中断。
  • 备数据库复制错误。
  • 预期角色与实际角色不符。
  • 故障倒换后数据冲突(GTID)。
  • “binlog”被清理导致复制中断。
  • 人为对备数据库进行写操作,导致数据冲突。

处理方法

  1. 使用PuTTY,登录om_core1_ip节点。

    默认帐号:paas,默认密码:QAZ2wsx@123!

  2. 执行以下命令检查数据库复制状态。

    cd /opt/paas/oss/manager/apps/DBAgent/bin

    sh dbsvc_adm -cmd query-db-instance | egrep "DBInstanceId|mysql.*Slave"

    显示如下:

    DBInstanceId                             ClassId  Service Name               Region        Tenant Stage    IP          Port   State   DBType  Version  Role  Rpl Status   MasterID   
    apmdbsvr-10_90_73_163-3@10_90_73_164-3   primary  apmdbsvr-10_90_73_164-3    cn-global-1   om     Product 10.90.73.164 32082  Up      mysql   5.6.35   Slave Normal       apmdbsvr-10_90_73_163-3   
    apmdbsvr-10_90_73_178-21@10_90_73_179-21 primary  apmdbsvr-10_90_73_179-21   cn-global-1   om     Product 10.90.73.179 32080  Up      mysql   5.6.35   Slave Abnormal (212)      apmdbsvr-10_90_73_178-21
    说明:
    • 屏幕输出可能随版本不同而不同,请以实际为准,这里只需要关注“Rpl Status”的值。

      Normal表示正常。

      Abnormal表示异常,后面括号中数字为状态码。

    • 本示例中apmdbsvr-10_90_73_178-21@10_90_73_179-21实例复制状态异常。

    如果上述结果中存在Abnormal,需要继续定位原因并处理。

  3. 复制状态异常状态码及处理方式参考表23-3

    表23-3 复制状态错误表

    错误码

    中文说明

    可能原因

    处理建议

    101

    数据库实例所在节点DOWN,或实例DOWN。

    1. 对应数据节点未启动。
    2. 对应数据库实例未启动,或数据节点磁盘空间满。
    3. 主备节点网络通信异常。
    1. 结合实例编号的运行状态(UP/DOWN),查看该实例所在主备数据节点是否都启动。
    2. 查看数据库实例是否启动,检查数据库启动日志。
    3. 检查主备节点通信是否正常。

    102

    数据库实例角色错误,出现双主。

    人为对主备实例所在节点设置忽略节点。

    请确认设置忽略节点原因后,再通过switchtool.sh取消。具体命令请参考《命令参考》。

    103

    数据库实例角色错误,出现双备。

    人为对主备实例所在节点设置忽略节点。

    请确认设置忽略节点原因后,再通过switchtool.sh取消。具体命令请参考《命令参考》。

    104

    数据库实例角色错误,角色与ZK上的不符合。

    人为对主备实例所在节点设置忽略节点。

    请确认设置忽略节点原因后,再通过switchtool.sh取消。具体命令请参考《命令参考》。

    Delay(201)

    复制延迟。

    1. 短时间有大量数据库写操作导致复制处理延迟。
    2. Redis正在进行数据全同步。

    观察一段时间,如果还未恢复或经常出现复制延迟,请联系DBA定位。

    • MySQL备实例的show slave status出现Seconds_Behind_Master>0。
    • Redis备实例的info命令出现aof_rewrite_in_progress/rdb_bgsave_in_progress/loading。

    200

    MySQL主备实例网络通信异常。

    备实例和主实例的IO通信异常,对应MySQL的IO线程异常(Slave_IO_Running是NO)。

    1. 查看主数据库实例是否启动,主实例所在节点是否磁盘满,或者主备实例节点是否可以相互通信。
      如果是网络原因导致的故障,请联系管理员修复服务器网络;如果主实例未启动,请参考101状态码处理方式处理;如果主实例所在节点磁盘满,请清理磁盘后,请执行如下操作:
      1. 参考《维护指南》中“停止数据库”章节及“启动数据库”章节,停止后再启动故障实例的主实例。
      2. 观察一段时间,如果还未恢复,使用手工方式重建备。具体重建备方式请参考“重建数据库备节点实例”章节。
    2. 通过在备实例执行show slave status查看具体MySQL错误码,收集具体的错误信息。

    210

    MySQL备数据库实例的SQL线程异常

    1. Slave_SQL_Running是NO。
    2. 人为用超户dbuser对备实例违规进行写操作。

    请参考“数据库备节点实例复制状态异常”章节处理。

    211

    MySQL主备模式:备数据库实例比主数据库实例的数据GTID多。

    人为用超户dbuser对备实例违规进行写操作。

    请参考“数据库备节点实例复制状态异常”章节处理。

    212

    MySQL双主模式:GTID有数据冲突。

    MySQL最近发生故障倒换。前有部分数据未复制到备实例,倒换后原来主实例有数据冲突。

    请参考“数据库备节点实例复制状态异常”章节处理。

    213

    MySQL主备模式:异常倒换数据冲突。

    MySQL没有配置双一。故障倒换前数据同步到备,但是还没有在老主落盘导致数据冲突。

    1. 请参考“数据库备节点实例复制状态异常”章节处理。
    2. 建议在MySQL配置文件(my_product.cnf)都配置为一:

      sync_binlog=1;

      innodb_flush_log_at_trx_commit = 1

    说明:
    • 小于200的错误码为MySQL/Redis通用错误码。
    • 大于等于200的错误码为MySQL特有复制异常,

      其中21开头的错误码可以通过MySQL一键式重建备修复。

翻译
下载文档
更新时间:2019-08-19

文档编号:EDOC1100043088

浏览量:22032

下载量:452

平均得分:
本文档适用于这些产品

相关版本

相关文档

Share
上一页 下一页