PW Redundancy
PW Redundancy信令机制
引入PW保护的机制势必打破原有PWE3中AC与PW一一对应的模型。为了保持原有的转发行为,必须保证形成冗余备份的一组PW中只有一条处于工作状态,其它的都处于备用状态。
LDP PW信令(RFC)中规定使用PW Status TLV来传递PW的转发状态(forwarding status),PW Status TLV可以由Label Mapping消息或Notification消息携带。PW Status TLV是一个32比特的状态码,其中的每一位都可以标识一种PW的转发状态。PW Redundancy在此基础之上引入了一个新的PW状态码(0x00000020 - PW forwarding standby)表示PW当前处于备用状态。
只有PWE3方式VPLS支持PW Redundancy。
Primary/Secondary和Active/Inactive
PW Redundancy中有两组概念较为重要,需要特别说明:
Primary/Secondary指的是PW的转发优先级,是PW的配置参数
Primary PW被设定为优先用于流量转发,Secondary PW用于保护Primary PW,在两者PW状态相同的情况下使用Primary PW转发流量。目前对于某个Primary PW最多只能再配置一条Secondary PW。值得一提的是,Bypass PW也可看作是一条Secondary PW。
Active/Inactive指的是PW的转发状态,是PW的运行状态,非配置参数
只有处于Active状态的PW才被用于转发流量。PW本地的Active或Inactive状态取决于PW本地和远端的信令状态和优先级(配置的Primary/Secondary)。处于最优状态和最高优先级的PW才会被选择为Active,用来转发流量,其它的PW均处于Inactive状态。处于Inactive状态的PW不用于转发流量,但可以配置接收流量(只能用于VLL PW)。
PW Redundancy的工作模式
PW Redundancy的工作模式在配置了主备PW的PE设备上指定。如果不指定则按照PWE3 FRR处理。
PWE3 FRR方案中PE设备本地确定PW的主备,且不会通告远端,因此远端PE不感知PW的主备状态。该方案是私有实现,不推荐使用。
Master/Slave模式:
在此种配置模式下,本地确定PW的主备,并通过信令协议通告远端,远端PE可以感知主备状态。PW侧和AC侧的主备关系互不影响。可以实现PW侧和AC侧故障隔离。
Independent模式:
在此种配置模式下,本地PW的主备状态由远端AC侧协商结果确定,远端通告主备状态到本地。AC侧故障发生的保护倒换会影响PW侧同时进行保护倒换,不能实现故障隔离。
在配置PWE3的场景中,通常采用Independent模式,可以实现良好的切换性能。
PW Redundancy倒换机制
PW Redundancy需要与AC侧的跨设备保护相互配合实现业务的双归保护。目前设备支持CE非对称接入PE的PW Redundancy,其倒换机制如下:
协商确定主备PW
PW主备协商流程如下:
AC侧确定PE设备主备
E-Trunk确定PE1和PE2的主备关系。假设PE1为master,PE2为backup。
动态协商确定PW的主备
E-Trunk与PW联动,将PE的主备状态通知给PW,从而确定PE1和PE2上PW的本地状态。
PE1和PE2分别将PW的本地状态通过LDP信令发送给PE3。
这两个信令到达PE3的先后顺序是不确定的。
PE3收到PE1和PE2发送的信令后,确定到达PE1的PW1为主PW,到达PE2的PW2为备PW。
此时,单向流量路径为CE1->PE1->PW1->PE3->CE2。
PW的主备状态倒换
PW的主备状态在如下情况会发生倒换:
改变E-Trunk的优先级,PW重新进行协商。
PE1节点故障。E-Trunk感知到节点故障后,PE2的状态由backup变为master,PW重新进行协商。
如果是backup节点PE2发生节点故障,不影响PW的主备关系。
PE1和CE1之间的AC链路故障,与PE1节点故障的处理流程相同。
PE2与CE1之间的AC链路故障,不影响PW的主备关系。
PW的主备状态倒换后,单向流量路径为CE1->PE2->PW2->PE3->CE2。
节点或链路故障恢复后,E-Trunk重新协商。由于配置优先级没有改变,故障前的master节点PE1重新成为master。
公网保护
当PE1和PE3之间链路出现故障时,如果PW1的状态变为Down,则可以通过PE1和PE2之间的bypass PW进行切换。PE3感知到故障后,流量从PW1切换到PW2。PE1感知到故障后,流量切换到bypass PW。PE2在这种情况下,把PW2和bypass PW组合起来,担当SPE的角色,进行报文的转发。
此时,单向流量路径为CE1->PE1->bypass PW->PE2->PW2->PE3->CE2。
如果公网配置了TE FRR或者LDP FRR等保护策略,可以不配置bypass PW。
BFD检测管理PW
在PE3和PE1之间、PE3和PE2之间分别配置业务PW和管理PW,并配置业务PW绑定管理PW。
在业务PW数量较多时,通过业务PW和管理PW的绑定,可以减少配置BFD会话的数量,节约系统资源,同时减少BFD报文的交互,节省带宽。
配置BFD检测管理PW,来加速检测公网链路故障。BFD检测到故障后,通知管理PW;管理PW将故障通告给绑定的业务PW,业务PW进行切换。
PW回切策略
如图5-11所示,在CE非对称接入组网中,PE3收到主用PW故障恢复消息后,根据配置的PW回切策略进行相应处理。
PW回切策略有三种:
不回切:流量不切换到主用PW上。
立即回切:立即将流量切换到主用PW上。
延迟回切:延迟一段时间后再将流量切换到主用PW上。
流量回切后PE3立即向备份PW的对端PE2通告故障,从而通过联动使CE1进行快速的AC链路切换,并延迟一定时间(或立即)再向备份PW的对端PE2通告故障恢复,避免CE1因PE间的传输延时造成报文丢失。