USG5100 keepalive设置时间过短导致BGP震荡

发布时间:  2012-10-22 浏览次数:  227 下载次数:  0
问题描述
 某国局点反馈BGP闪断,每天发生两到三次,检查BGP配置无异常。
版本信息:Eudemon 200E V100R005C00SPC100
组网:c路由器-rt1--vlan trunk---  Eudemon -195.5.127.16/30---C路由器 rt2 
告警信息
BGP断连:
Feb 23 01:13:12 2012-02-23 01: 14:26 cn-msk-frw02 %%01BGP/3/STATE_CHG_UPDOWN(l): Peer 10.200.77.41 state was changed from ESTABLISHED to IDLE. (BGP address family=public)
看日志发现有大量keeptimer超时:
Feb 24 08:26:30 2012-02-24 08: 27:46 cn-msk-frw02 RM/7/RMDEBUG:#015#012 BGP.public: 10.77.16.57 Current event is KATimerExpired.#015
处理过程
timer keepalive 1 hold 3
这条命令默认值为60秒,3次重传,每次20秒。本局点配置为3秒,3次重传,每次1秒。
现阶段的版本中,cpu同时处理管理平面及数据平面的任务,如果网络变动较大,或者在发生网络风暴时,keepalive由于优先级较低,不会被处理,如果配置的时间过短会导致不能处理而认为丢失,在此局点的配置中就属于这种 情况。所以解决方法就是把处理时间调长一点,可以选择默认值。
根因
BGP闪断是由于未收到、对端未收到keepalive,并且从诊断日志中看到BGP邻居断连的原因全部为4/0,也就是holdtimer超时导致(期间未收到keepalive)。
建议与总结

END