两台S9312(V200R001C00SPC300)做VRRP,上连友商的路由器,ping专线对端的113地址掉包

发布时间:  2014-12-29 浏览次数:  300 下载次数:  0
问题描述
两台S9312(V200R001C00SPC300)做VRRP,上连友商的路由器,全局开启了STP  enable,全网路由跑的OSPF。用户的网关配置在S93上。用户1端ping专线对端的113地址掉包,,主的S93ping网关有掉包的情况,发4个包就会掉三个包,用户pingVRRP的虚地址不丢包,ping友商路由器的内网地址也不丢包
告警信息
处理过程
1.确定的组网,故障现象,确定用户1pingS93的实地址不丢包,pingVRRP的虚地址也不丢包,到友商路由器的内网地址也不丢包

2.换网线也未解决,初步排除是物理链路导致的

3.检查友商路由器连对端专线接口的端口速率,经验证,速率为1000M,正常,排除端口速率导致的丢包

4.怀疑网络的STP有问题,在eth-trunk 接口配置   bpdu bridge enable 
配置了边缘端口后,STP状态正常,但仍有丢包,排除由于STP导致丢包

5.采集S93的diag信息
日志中有报光模块收发光已达上限的告警:
Nov  8 2014 12:42:12 YU_Shu_Zi_Jin BASETRAP/3/OPTPWRABNORMAL: OID 1.3.6.1.4.1.2011.5.25.129.2.17.1 Optical module power is abnormal. (EntityPhysicalIndex=70107342, BaseTrapSeverity=5, BaseTrapProbableCause=67697, BaseTrapEventType=5, EntPhysicalContainedIn=69992457, EntPhysicalName="GigabitEthernet11/0/3", RelativeResource="", ReasonDescription="Overlow receiving power of fabric module, detail information is as follows: Now power is -30.8299999; Set lower threshold is -19.0000000; Default lower threshold is -19.0000000;")                                 buildrun-info               
NFPT                  0%         0/ 161d3cc       NFPTNFP timer task           
检查光模块的收发光是否正常,更换了光模块后仍存在丢包的情况

6.日志中有路由变化的信息,初步怀疑路由有问题:
Nov  8 2014 12:41:32 YU_Shu_Zi_Jin %%01RM/4/IPV4_DEFT_RT_CHG(l)[342]:IPV4 default Route is changed. (ChangeType=Delete, InstanceId=0, Protocol=OSPF, ExitIf=Vlanif14, Nexthop=11.84.113.252, Neighbour=0.0.0.0, Preference=10, Label=NULL, Metric=27)

7.另,还有IP地址冲突的告警
1.3.6.1.4.1.2011.5.25.155.31.4 IP addresses of DRs in an intra area conflict
可能同一个区域内的非直连的两台交换机配置了相同的IP地址,其中一台作为DR发布network LSA,初步怀疑是网络的OSPF有问题

进一步证实:
NSSA      11.85.240.112   11.85.208.222     1460 
36    80000030       1 
再远程收到NSSA 相同LSDB导致冲突。
Nov  9 2014 12:10:02 YuShu_YeWu
OSPF/2/IPADDR_CONFLCT:OID       //在一个区域内有至少两台非直连交换机的Router ID配置相同,导致Router LSA不断刷新,产生路由振荡
1.3.6.1.4.1.2011.5.25.155.31.4 IP addresses of
DRs in an intra area conflict.
(ProcessId=1,
AreaId=0.0.0.42, SelfIfnetIndex=0, NbrIpAddr=11.
84.114.66, RouterId=11.84.114.81,
IntierfaceIpAddress=11.84.113.252,
InterfaceName=Vlanif14)


8.最终检查到是此次问题是新老设备替换,内网的老设备仍处于开启状态,老设备的OSPF的Route ID和新设备的一致
根因
更换老设备没有关闭导致
在一个区域内有至少两台非直连交换机的Router ID配置相同,导致Router LSA不断刷新,产生路由振荡
解决方案
把友商的老设备关闭,问题解决
建议与总结
新设备替换老设备时需要注意:

如果设备之前是使用的OSPF,一定要注意把老设备给关闭。不然就会Router ID配置相同,导致Router LSA不断刷新,产生路由振荡

END