掩码长度配置不一致导致流量负载不均

发布时间:  2012-12-13 浏览次数:  87 下载次数:  0
问题描述
 

如下拓扑(此处只重点体现问题相关部分,其他部分部分未画细节)所示,两个站点SV和BSW,每站点各有两台NE40E,通过dot1q子接口连接,中间通过传输设备,传输侧为VLAN分配带宽,2G语音流量使用vpn-instance 2G_Traffic,使用651、652、751、752四个VLAN。VLAN带宽为共享式,如给VLAN651分配110M,那么SV-01与BSW-01之间所用的VLAN651和SV-02与BSW-02之间所用的VLAN651加一起共用110M,在计算利用率时把两边子接口的流量加和再比较。

路由器跑OSPF,正常情况下,SV和BSW上NE40E的vpn-instance 2G_Traffic的路由表中,到达对方业务设备的IP段应该是有4条等价路由,流量应该在4个VLAN上负载分担。



问题现象是,从MRTG流量图上发现这四个VLAN上的流量并没有像负载分担预期的那样接近,而是有较大的差别。其中VLAN651、751流量较接近,VLAN652、752流量较接近,且前者是后者的约二倍。

对接口流量进行统计对比,如下表格所示,结果确实如此。

处理过程
 

1、查SV站点连接上连接口板类型,为LPUF-10,查SV-01和SV-02互联接口板类型,LPUF-10和LPUF-21各一块,有一块LPUF-21,对负载分担效果会有影响,但不应该影响如此之大。

2、查看路由表,发现异常,路由表中不是只有4条路由,而是有6条,其中VLAN651和VLAN751对应的子接口出现两次。

3、如下是BSW-1上的路由表信息,进一步观察可发现,从651出去的路由,两个下一跳不同,分别指向SV-1的651和SV-2的651的IP地址。
<BSW-BSC-NE40E-01>dis ip routing-table vpn-instance 2G_Traffic 10.67.0.0
Route Flags: R - relay, D - download to fib

------------------------------------------------------------------------------

Routing Table : 2G_Traffic
Summary Count : 6
Destination/Mask    Proto  Pre  Cost       Flags NextHop         Interface
  10.67.0.0/16  O_ASE  150  1            D   10.166.1.9      GigabitEthernet1/0/0.652
                    O_ASE  150  1            D   10.166.2.129    GigabitEthernet5/0/0.751
                    O_ASE  150  1            D   10.166.2.5      GigabitEthernet1/0/0.651
                    O_ASE  150  1            D   10.166.1.13     GigabitEthernet5/0/0.752
                    O_ASE  150  1            D   10.166.2.1      GigabitEthernet1/0/0.651
                    O_ASE  150  1            D   10.166.2.133    GigabitEthernet5/0/0.751
4、查SV和BSW两边对应各个接口的配置,发现掩码不一致,如下表所示。

5、分析使用的IP地址和掩码,可以发现,对于VLAN651和VLAN751来说,四台设备是在一个网段内,而对于VLAN652和VLAN752来说,则是点对点连接。
6、因此,对于BSW-1来说,VLAN651和VLAN751分别同时连接到SV-1和SV-2,而VLAN652和VLAN752只连接到SV-1,其他设备也类似。那么,在路由表中,会出现六条等价路由,其中从VLAN651、751经过的各两条,从VLAN652、752经过的各一条。当NE40E进行负载分担时,流量会在6条等价路由中负载均衡开,而由于走VLAN651、751上路由是VLAN652、752上路由的双倍,流量被负载到上面的概率也双倍,所以流量更高,约呈两倍关系。

根因

负载分担的4条路由掩码长度不一致,导致引流出现问题,出现负载分担不均

解决方案
 

把掩码长度更改为统一使用30位,然后观察,问题解决,负载效果良好

建议与总结
在做设备配置时,此类负载分担的场景,要保证掩码配置一致。无论是在规划时还是在做配置时,都应该细心,注意细节。

END