相关概念
本节介绍了远程复制的Pair、同步、分裂、主从切换、数据状态、从文件系统可读写等相关概念。
远程复制租户Pair
远程复制租户Pair是指本端存储系统的租户和远端存储系统的租户之间的远程复制关系。远程复制租户Pair和远程复制Pair之间的关系如图1-2所示。
远程复制Pair
Pair是指主文件系统和从文件系统之间的数据复制关系。在文件系统远程复制中,数据只能由主文件系统经过链路复制到从文件系统。在进行数据复制之前,必须先建立主文件系统与从文件系统之间的Pair关系,正如在通话之前需要通过拨号建立两台电话之间的连接一样。在配置远程复制时,主端存储系统的一个主文件系统和从端存储系统的一个从文件系统构成一个Pair。
Pair在不同的远程复制阶段可能处于不同的Pair运行状态。通过查看Pair运行状态,可以及时地根据状态取值对远程复制进行同步、分裂、主从切换等操作,并在操作结束后判断操作是否成功。远程复制中的Pair运行状态及状态说明如表1-2所示。
运行状态 |
状态说明 |
---|---|
正常 |
主文件系统和从文件系统的数据成功同步完成。 |
分裂 |
“分裂”是指主从文件系统之间的数据暂停复制的一种Pair运行状态。由于业务需要,管理员通过DeviceManager手动断开主文件系统和从文件系统之间的Pair关系,则Pair运行状态为“分裂”。 |
异常断开 |
远程复制所用的链路断开或远程复制所用文件系统故障,导致主文件系统和从文件系统之间的Pair关系断开,则Pair运行状态为“异常断开”。 |
待恢复 |
Pair异常断开,在故障恢复以后,如果需要以“手动”策略恢复远程复制,则Pair运行状态被标识为“待恢复”,提示用户需手动进行同步操作,恢复原有主文件系统和从文件系统的Pair关系。 |
失效 |
Pair异常断开后,如果主文件系统或从文件系统原有的Pair属性改变(例如从站点的远程复制从文件系统被删除),导致主从站点配置不一致,则Pair运行状态为“失效”。 |
正在同步 |
主文件系统正在向从文件系统复制数据,此时,从文件系统的数据不可用。 |
数据状态
远程复制通过判断从文件系统在某一时间点数据是否可用,标识当前Pair的数据状态。当灾难发生时,远程复制需要根据Pair的数据状态判别是否允许进行主从切换。远程复制中Pair的数据状态为“完整”和“不完整”两种。
远程复制Pair的同步
是指将数据由主文件系统复制到从文件系统的过程。当主文件系统和从文件系统数据不一致时,可以通过手动同步操作,让主从远程复制对象数据保持一致。
在同步过程中,存储系统会同步文件系统过期时间和WORM时钟信息。但是只有当删除远程复制后,才能在从端查询到更新后的值。
远程复制Pair的分裂
分裂是指暂停由主文件系统向从文件系统同步数据。远程复制被分裂后,主从文件系统之间的Pair关系依然存在,此时主机对主从文件系统数据的读写权限并未改变。
对已经创建好的Pair,若需要暂时断开远程复制关系,例如,链路带宽不足,影响关键业务,需要暂停链路上远程复制数据的同步。此时,可以利用分裂操作来暂停数据的同步。
分裂和同步结合使用,可以对远程复制的数据同步过程进行有效的控制。
远程复制Pair的主从切换
主从切换是指Pair中文件系统的主从关系转换的过程。主从切换改变了远程复制中原有文件系统的主从关系,形成一个新的Pair。在远程复制中,主从切换通常应用于以下两种情况:
- 主站点灾难恢复后,重新建立远程复制链路,管理员首先在主站点或从站点对远程复制进行主从切换,当数据同步完成后,管理员再在主站点或者从站点对远程复制进行主从切换。
- 正常情况下需要对主端存储系统进行升级,例行维护等需要由从文件系统接管业务的操作,管理员在主站点或者从站点对远程复制进行主从切换。
主从切换的目的是为了在从端存储系统上运行业务,因此要求切换之前的从文件系统数据是可用的。通过查看从文件系统的数据状态来判别从文件系统数据是否可用。
从文件系统可读写
从文件系统可读写是指从文件系统可以接收来自主机的数据且自己的数据可以被主机读取。
远程复制配置完成后从文件系统默认为只读,此时无需分裂可直接对从文件系统进行挂载,被挂载了的从文件系统可以被主机读取。如果主文件系统发生故障,主机的读业务可以由从文件系统承载,读业务不受影响。从文件系统可读常用于在复制过程中需要读取从端数据的场景,不适用于对数据一致性有严格要求的场景。
如果主文件系统出现故障,管理员需要手动设置从文件系统为可读写,以便从端存储系统能够接管主机业务,保证业务持续运行。设置从文件系统可读写的两种常见场景如下:
- 主文件系统故障,且远程复制链路断开,则需要在从端存储系统设置从文件系统可读写。
- 主文件系统故障,但远程复制链路正常,则需要先分裂Pair,然后在主端或从端存储系统设置从文件系统可读写。
链路压缩
链路压缩是一种在线压缩技术。异步远程复制的过程中,在主端提前对当前传输的数据进行压缩传输,当从端接收到数据后,再进行解压操作从而降低传输带宽的消耗。存储系统支持的链路压缩有以下特点:
- 数据在线压缩
对链路上传输的数据进行在线实时压缩。
- 智能压缩
系统提前识别数据的可压缩性,从而最大程度的避免无效的压缩,提升传输效率。
- 高可靠性和安全性
采用无损压缩技术保证数据安全性。采用多重校验技术保证数据可靠性,当从端收到数据后,会先校验数据的正确性,解压完成会再次校验解压前后数据是否一致。
- 用户无感知
链路压缩不影响主机在线业务,用户无感知。
- 兼容全量、增量备份
链路压缩不区分上层业务,对所有需要进行网络传输的数据进行压缩。