骨干网流量设计不合理导致NE5000E扩容后流量不均衡

发布时间:  2012-07-26 浏览次数:  79 下载次数:  6
问题描述
组网见附件:
组网说明:
1、 割接前NE5000E与思科12816共同组成该地市C3级骨干网,两设备通过10G上边至C2级两D1平面的骨干路由器。两C3级路由器通过2*2.5G POS端口互连,NE5000E通过2*2.5G POS端口下连城域网,C12816能过3*2.5G POS端口下连城域网。
2、 骨干路由器通过将IGP COST值转换为BGP的MED值下发给城域网,引导上行流量,但城域网将MED值过滤掉了,导致本应在两城域网核心路由器的对穿流量在两C3级骨干路由器进行对穿。
3、 由于两城域网核心路由器上行链路带宽不均衡(NE5000E与城域网之间为2*2.5G,C12816与城域网之间为3*2.5G),城域网通过调整核心路由器下挂的AR或BRAS设备IGP的默认路由COST值,改变路由选择城域网路由选择,使一部分IGP默认路由绝对优选至C12816(城域网)侧出城域网,而另外一部分则还是根据IGP等值路由上行至城域网核心路由器,出城域网。
割接后出现问题:
1、 NE5000E与C12816(C3)的上行链路各由原来的10G更改为20G;割接后发现NE5000E的下行至城域网流量比C12816(C3)下行至城域网流量大一半左右(NE5000E两个2.5G pos端口流量为1G,C12816(C3)的3个2.5G POS端口流量为500M左右)
2、 如果到了白天或者流量高峰期还这样的话,NE5000E到城域网方向的5G链路将会出现拥塞,影响城域网用户上网。
告警信息

处理过程
1、 查看NE5000E配置,无异常。
2、 经从NE5000E和C12816上查看学习到城域网的BGP路由都直接被优选(下一跳直接为NE5000E或C12816下连的城域网核心路由器)。
3、 查看城域网核心路由器配置,没有带其它BGP属性,并且两台核心路由器配置一样。
4、 通过在城域网内调整向骨干网发布BGP时的MED值来影响骨干网BGP路由的选路,并且记录骨干的对穿流量是否是在本地对穿(如果是骨干网流量设计的原因,则对穿流量不会是在本地对穿,而会在远端对穿),经确认对穿流量不是在本地对穿,而是在远端对穿。
5、 通过与客户协商将城域网内一部分网段的路由强制从C12816(C3)到城域网的7.5G链路上。使城域网的入网流量在正常情况下强行从C12816(C3)到城域网的7.5G链路。通过在城域网向NE5000E发布BGP路由时将MED值由默认的0更改为200(根据BGP选路原则LAOMEN,本地优选级如在城域网设置则影响出网流量,AS-PATH在城域网设置影响入网流量,但该属性不宜在此处用,起点属性,此处不宜,通过在城域网向骨干NE5000E发布BGP路由时将MED值更改为200,使部分城域网入流量在正常情况强行从C12816(C3)入,从而达到流量与链路带宽均衡。
      
根因
1、 华为NE5000E设备配置有误。
2、 C12816学习城域网路由错误,城域网路由没有被C12816优选。
3、 城域网核心路由器配置有误,误带BGP属性。
4、 华为NE5000E或C12816设备bug问题。
5、 骨干网流量设计原因造成流量不均衡。 
      
建议与总结

END