抢占延时过短导致上行交换机异常重启后业务中断

发布时间:  2014-09-20 浏览次数:  113 下载次数:  0
问题描述
组网如图11-1所示。防火墙A为主用防火墙,并启用了抢占功能。交换机C异常重启后,业务中断。
图11-1 组网图

处理过程
步骤 1 检查防火墙和交换机日志。
交换机C故障后,防火墙主备切换,防火墙B和交换机D接管业务。但是交换机C在重启过程中,业务接口反复Up/Down。防火墙A在交换机C的接口状态为Up时,误认为链路已经恢复,启动抢占,导致业务中断。
经测试,交换机重启所需时间约为3分钟。
步骤 2 修改主用防火墙的抢占延时为240秒。
HRP_A<sysnameA> system-view
HRP_A[sysnameA] hrp preempt delay 240
根因
  •  防火墙主备切换失败。
  •  会话备份不完全。
  •  抢占延时过短,交换机C没有启动完毕。
建议与总结
如果启用抢占功能,必须保证抢占延时大于上下行设备重启所需要的时间。

END