故障设备替换
如图3-11所示,在运行EasyDeploy功能的网络中,以其中一台Client因硬件故障无法正常启动为例,说明故障设备替换的配置及实现的流程。
- 网络管理员发现有Client出现故障。设备安装工程师使用新的设备替换故障的设备,并且将新设备的MAC地址或ESN序列号上报给网络管理员。
根据新Client的MAC地址或ESN序列号,在Commander上配置新Client与故障Client的对应关系。
如果整网使能了拓扑收集功能,在只需要恢复配置文件的情况下,则不需要任何配置,通过拓扑匹配就可以发现新Client与故障Client的对应关系。
如果新Client还需要加载除配置文件以外的文件,则需要将这些文件保存至文件服务器,并且在Commander上指定新Client下载的文件名称。
- 配置完成后,新Client将会自动启动故障设备替换流程,将备份在文件服务器上故障Client的配置文件下载到新Client上,恢复原来的配置。
故障设备替换流程启动后,内部实现流程如图3-12所示。
故障设备替换内部实现流程分为以下4个阶段:
- 申请IP地址阶段:新Client发送DHCP请求,DHCP服务器回应,并携带Commander的地址信息。
- 获取文件信息阶段:新Client与Commander建立通信,根据新Client与故障Client的替换信息从Commander获取非配置文件的信息以及备份配置文件的记录。
下载文件阶段:根据获取到的信息先从文件服务器下载非配置文件,下载成功后再下载备份的配置文件。
Client下载文件的顺序:系统软件->补丁文件->Web网页文件->用户自定义文件->备份的配置文件(故障替换场景不支持下载License文件)。
- 文件生效阶段:下载文件完成后,根据文件激活策略激活文件,新Client进入正常运行状态。
故障替换流程中,如果申请IP地址阶段设备无法获取到IP地址,则设备会停留在该阶段定时发送请求获取IP地址,直到获取成功或者人工干预。在成功获取到IP地址后,如果出现错误(例如文件服务器信息错误等),则会切换至初始化状态重新开始,出错后再次切换至初始化状态,并且一直循环,直到人工干预。其中在文件下载过程中,如果第一次下载失败后,间隔1分钟再次尝试下载,共计尝试5次,如果仍失败,则Client会在延迟5分钟之后切换为初始化状态,重新开始DHCP流程,获取下载文件信息和下载文件。