A站点与B站点故障
当双活两个数据中心故障或其他原因导致双活数据中心均无法承接业务,需要将业务迁移至灾备中心,当双活数据中心灾难恢复后,再将业务回切至灾难发生前的业务运行状态,保证业务的持续运行。(假设组网连接方式为A-B-C,其中AB之间双活,BC之间远程复制。)
故障处理
故障发生后,灾备中心C接管业务的具体策略为:
- 在灾备中心C,取消从资源保护。(选择BC远程复制Pair/一致性组,单击“
> 取消从资源保护”。)
- 将灾备中心C的从LUN映射给灾备主机。
- 灾备主机接管业务。
故障恢复
灾备中心从LUN接管业务后,远程复制会记录差异数据,以便用于后续增量恢复,缩短业务回切的时间。
故障恢复后,进行业务回切。具体的恢复回切策略为:
- 在数据中心A和数据中心B,移除数据中心A、数据中心B存储系统到生产主机的映射。
- 在数据中心B存储系统,查询双活Pair“本端资源主机访问状态”为“禁止访问”,则对双活Pair执行强制启动;如果双活Pair“本端资源主机访问状态”为“读写”且Pair的“健康状态”为“正常”,则执行暂停双活Pair(暂停数据中心A存储系统双活Pair成员LUN)的操作。
- 在灾备中心C,将生产中心B和灾备中心C的远程复制Pair关系进行主从切换,切换后灾备中心C的LUN为主LUN。
- 在灾备中心C,设置从资源保护状态为只读,使得生产中心B的LUN不会被主机读写。(选择BC远程复制Pair/一致性组,单击“
> 启用从资源保护”。)
- 在灾备中心C,同步远程复制Pair。
- 停止灾备中心业务。
- 在灾备中心C,移除灾备中心C存储系统到主机的映射。
- 在灾备中心C同步远程复制Pair。
- 同步完成后,在灾备中心C,分裂远程复制Pair,设置从资源保护状态为可读写。(选择BC远程复制Pair/一致性组,单击“
> 取消从资源保护”。)
- 将生产中心B的LUN映射到生产主机。
- 生产主机接管业务。
- 在数据中心B,启动双活Pair同步操作。
- 将生产中心A的LUN映射到生产主机。
- 等待双活同步完成后,对BC远程复制进行主从切换,切换完成后生产中心B的LUN为远程复制的主LUN,然后设置从资源保护状态为只读,并将BC远程复制重新启动同步。