四台CE交换机MLAG场景组播业务不能正常切换问题

发布时间:  2017-02-20 浏览次数:  244 下载次数:  0
问题描述

四台CE12808采用MLAG方式组网,组网场景如下:

经过测试,pim silent使能导致切换问题,pim silent 不使能导致cpu较高问题:
当PDC的TOR上面有组播源的时候,组播业务测试问题现在总结分为两种情况:
第一种情况:组播源接口不使能pim silent;
1. 组播接口下面不使用pim silent命令,四台设备可以正常选举DR,可以保证组播切换正常,但是cpu高;
2. 由于客户要求切换时间短,同时防火墙不支持BFD,hello报文较多,CE128的CPU利用率达到50%左右;
第二种情况:组播源接口使能PIM silent;
1. 如果四台同时使能PIM silent会导致第四台设备没有组播路由表,断开CE12808和防火墙互联线,导致组播业务不能正常切换;
2. 如果四台设备中主1主2使能pim silent,备1备2不使能,组播业务可以正常切换,可以正常生成组播路由表;
3. 如果主1主2不使能pim silent,备1备2使能,组播业务不能切换,不能生成组播路由表,可能由于PDC有组播源,SDC没有组播源;

测试CPU较高的原因跟pim silent 有关系,跟pim hello报文的timer可能没有关系:
现在配置的hello time为1,cpu较高,测试把pim hello恢复默认值,CPU依然很高!防火墙和S7700的CPU为15%左右:
CE12808的CPU较高,开启debug报文主要是BSR和neighbor报文,
Jan 21 2017 13:46:15.380 PDCGVSW01 %%01MRM/7/MCAST_DEBUG_INFO(d):CID=0x80e027f0;(VRFID=0): Receive BSR packet on interface 222. And use BSR Mechanism now.(3688)                                                                                                       
Jan 21 2017 13:46:15.380 PDCGVSW01 %%01MRM/7/MCAST_DEBUG_INFO(d):CID=0x80e027f0;(VRFID=0): Rejecting BSR message from 10.17.13.3 advertising C-BSR 10.16.160.241.(1677)                                                                                                
Jan 21 2017 13:46:15.382 PDCGVSW01 %%01MRM/7/MCAST_DEBUG_INFO(d):CID=0x80e027f0;(VRFID=0): [IFM]Process neighbor message, interface(222), neighbor address(10.17.13.3), generation id(-2087084061) and neighbor flag(22).(3345)                                        
Jan 21 2017 13:46:15.383 PDCGVSW01 %%01MRM/7/MCAST_DEBUG_INFO(d):CID=0x80e027f0;(VRFID=0): [IFM]Process neighbor message, interface(222), neighbor address(10.17.13.3), generation id(-513705694) and neighbor flag(22).(3345)  

处理过程

1、M-LAG场景网关需要配置pim silent,手册上有明确要求(配置silent后无CPU高问题)。
如下:
在SwitchA和SwitchB的用户侧VLANIF接口上使能PIM Silent,保证SwitchA和SwitchB均作为DR,并均向RP发送Join报文。

2、配置pim silent后,当前组网下数据中心之间二层链路组播报文无法转发,通过配置组播静态路由口解决(如此配置组播可正常切换)。

具体配置如下:

组播源VLAN接口:

#
interface Vlanif1013
 description muticast
 ip address 10.17.13.2 255.255.255.0
 vrrp vrid 1 virtual-ip 10.17.13.1
 vrrp vrid 1 priority 120
 vrrp vrid 1 preempt timer delay 60
 pim silent
 pim sm
 igmp enable
 mac-address 0000-5e00-0111
#

PIM配置:

#
pim
 static-rp 10.16.160.250 preferred
 hello-option dr-priority 120
 hello-option holdtime 3
 timer hello 1
#

MLAGDCI接口:

#
interface Eth-Trunk2
 description DCI L2 PDCGVSW02 to SDCGVSW01
 port link-type trunk
 undo port trunk allow-pass vlan 1
 port trunk allow-pass vlan 1000 to 1900
 mode lacp-static
 dfs-group 1 m-lag 2
 igmp snooping static-router-port vlan 1013
#

建议与总结
四台CE交换机MLAG场景组播业务不能正常切换会导致,需要配置pim silent 和 静态路哟接口来解决正常切换问题;

END