所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

S9300, S9300E, S9300X V200R010C00 配置指南-MPLS

本文档介绍了设备支持的MPLS相关配置。主要内容包括静态LSP的基本原理和配置过程、MPLS LDP的基本原理和配置过程、MPLS QoS的基本原理和配置过程、MPLS TE的基本原理和配置过程、MPLS OAM的基本原理和配置过程、Seamless MPLS的基本原理和配置过程,并提供相关的配置案例。
评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
MPLS TE可靠性

MPLS TE可靠性

可靠性概述

对于MPLS TE隧道而言,其可靠性技术的必要性包含以下三个方面的含义:
  • 用户如果修改了已建立完成并承载业务的MPLS TE隧道的一些属性(比如带宽),这意味着此隧道要按照修改后的属性参数重新建立路径,并将流量切换到新的路径上,而这一过程就有可能引起流量的丢失。

  • 对于已建立完成并承载业务的MPLS TE隧道而言,如果其路径上某一节点或链路出现了故障,这就要求其能够在备份的路径上重新建立隧道并将流量切换到新的路径上,而这一过程同样会引起流量的丢失。

  • 对于已建立完成并承载业务的MPLS TE隧道而言,如果其路径上某一节点控制层面故障但转发层面并没有故障,这就要求在控制层面进行故障恢复的过程中流量转发不中断。

MPLS TE隧道用来承载的业务都是用户的关键业务,在可靠性方面都有很高的要求,因此MPLS TE提供了如表5-14所示的可靠性技术。
表5-14  MPLS TE可靠性特性列表

技术分类

说明

包含特性

隧道属性更新中的可靠性机制

保证属性更新前后建立的CR-LSP流量切换中的可靠性。

故障检测技术

对MPLS TE网络中的故障进行快速检测,确保快速触发故障的保护技术生效。

流量保护技术

网络级可靠性:对MPLS TE网络端到端路径以及局部节点进行保护。

设备级可靠性:确保MPLS TE网中的节点控制层面故障时,转发层面不中断。

Make-Before-Break

Make-Before-Break机制用来解决隧道属性变更导致的新旧CR-LSP切换过程中的流量丢失问题,可以增强MPLS TE隧道的可靠性。

产生原因

对于一条建立好的MPLS TE隧道而言,当链路属性或隧道属性变化导致有了更优的路径时,原隧道要按照新的属性重新建立CR-LSP,并在建成后将流量切换到新的CR-LSP上。在上述过程中很可能出现新的LSP尚未建立完成时就把流量切换过去而导致流量丢失的问题。MPLS TE提供了Make-Before-Break机制来避免上述问题的发生。

实现过程

Make-Before-Break是一种在原有路径被拆除前先建立新路径(也称为Modify LSP),将流量进行切换的一种机制。它可以在进行流量切换时尽可能不丢失数据和不占用额外带宽的前提下改变MPLS TE隧道属性。Make-Before-Break是通过SE风格实现的。

新路径建立时,可能会与原路径在某些共同链路上竞争带宽资源,这会导致新路径竞争失败而无法建立。通过Make-Before-Break机制,新路径需要预留的带宽不被重复计算,即采用原路径使用的带宽。路径重合的地方不额外占用带宽,路径不重合的地方还是额外占用带宽。

图5-19  Make-Before-Break示意图

图5-19中,假设所有链路最大可预留带宽为60Mbit/s。新建一条Switch_1到Switch_4的CR-LSP,带宽为40Mbit/s,路径是Path1。

现在希望将路径改为Path2,通过负载较轻的Switch_5进行数据转发。此时Switch_3→Switch_4上剩余的可预留带宽只有20Mbit/s,不足40Mbit/s。这种情况可以通过Make-Before-Break机制来解决,新建立的路径Path2在Switch_3→Switch_4上进行资源预留时采用原路径使用的带宽。新隧道建立成功后,流量转到新路径上后拆除原路径。

与此类似的是增加隧道的带宽,只要共用链路的可预留带宽满足增量要求,新的CR-LSP就可以建立成功。

仍以图5-19为例,假设所有链路最大可预留带宽为60Mbit/s。新建一条Switch_1到Switch_4的CR-LSP,带宽为30Mbit/s,路径是Path1。

现在希望将路径改为Path2,通过负载较轻的Switch_5进行数据转发,并将带宽增大为40Mbit/s。此时Switch_3→Switch_4上剩余的可预留带宽只有30Mbit/s,不足40Mbit/s。这种情况也可以通过Make-Before-Break机制来解决,新建立的CR-LSP的路径Path2在Switch_3→Switch_4上进行资源预留时采用原路径使用的带宽,并追加增量带宽。新的CR-LSP建立成功后,流量转到新路径上后拆除原路径。

切换延迟和删除延迟

在实际应用中,MPLS网络各节点所承载业务状态都不尽相同,当上游和下游节点的业务繁忙程度相差比较大时,有可能出现原CR-LSP被提前删除,导致流量短暂中断的现象。

为了避免这一问题,Make-Before-Break机制引入了切换延迟时间和删除延迟时间。当新CR-LSP建立成功时,延迟一定的时间再将流量转到新CR-LSP上,并再延迟一定的时间删除原来的CR-LSP。

RSVP Hello

RSVP的Hello扩展机制用于快速检测RSVP节点之间的可达性,通常用来触发TE FRR的路径保护。同时还可以检测邻居节点是否处于重启状态,以支持邻居实现RSVP GR

产生原因

RSVP Refresh消息除了可以进行节点间状态(包括PSB和RSB)同步之外,另外起到的一个作用就是可以检测各邻居间的可达性,维护RSVP节点之间的邻居关系。

但是这种软状态机制所采用的Path消息和Resv消息检测邻居关系是否可达的速度较慢,在路径出现故障时不能及时触发业务向备份路径切换流量。因此,引入RSVP Hello扩展来解决这个问题。

实现过程

RSVP Hello的实现过程如下:

  1. Hello握手机制

    图5-20  Hello握手机制

    图5-20,LSRA、LSRB之间有链路直接相连。

    • 当LSRA接口下使能了RSVP Hello时,LSRA会向LSRB发送Hello Request消息。

    • 若LSRB收到了Hello消息,并且LSRB也使能了RSVP Hello,就会给LSRA节点回复Hello ACK消息。

    • LSRA收到LSRB的Hello ACK消息后,就确认LSRA的邻居LSRB是可达的。

  2. 检测邻居丢失

    在LSRA向LSRB发送Hello Request握手成功后,LSRA与LSRB就开始互通Hello消息。当LSRA连续三次向LSRB发送Hello Request消息后,LSRB仍然没有给LSRA回Hello ACK消息,此时就认为LSRB邻居丢失,触发TE FRR切换并重新初始化RSVP Hello

  3. 检测邻居重启

    当LSRA和LSRB都使能RSVP GR功能时,在LSRA检查到邻居LSRB丢失后,LSRA就等待LSRB发送有GR扩展的Hello Request消息。收到此消息后,LSRA开始协助LSRB恢复RSVP状态,并向LSRB发送Hello ACK消息。LSRB收到LSRA回复的Hello ACK消息后,发现LSRA已开始协助自己进行GR。然后LSRA和LSRB互通Hello消息,维持GR恢复状态。

说明:
当LSRA和LSRB同属于一条CR-LSP时:
  • 如果没有使能GR功能,但使能了TE FRR功能,则检测到邻居丢失时,会触发流量切到旁路隧道(Bypass CR-LSP)上,保证流量不中断。

  • 如果使能了GR功能,则优先按照GR方式处理。

适用场景

RSVP Hello适用于TE FRR和RSVP GR的场景中。

CR-LSP备份

CR-LSP备份技术能够为MPLS TE隧道提供端到端的路径保护能力,当入节点感知到主CR-LSP不可用时,会将流量切换到备份路径上。当主CR-LSP路径恢复后再将流量切换回来,以实现对主CR-LSP路径的备份保护。

相关概念

CR-LSP备份有热备份和普通备份两种方式,除了这两种方式之外,为了进一步提高MPLS TE隧道的可靠性,系统还提供了一种逃生路径技术。

  • 热备份(Hot-standby):指创建主CR-LSP后随即创建备份CR-LSP。当主CR-LSP故障时,将业务流量切换至备份CR-LSP。

  • 普通备份:指主CR-LSP故障后创建备份CR-LSP,再将业务流量切换至备份CR-LSP。

  • 逃生路径:指在主、备CR-LSP都故障时,创建一条临时的CR-LSP,将业务流量切换到逃生路径上。

    图5-21,主CR-LSP路径为PE1→P1→P2→PE2;备份CR-LSP路径为PE1→P3→PE2。当主备CR-LSP都故障时,PE1触发建立逃生路径PE1→P4→PE2。

    图5-21  逃生路径示意图
    说明:

    逃生路径没有带宽保证,可以根据通过配置逃生路径的亲和属性和跳数限制来控制其途经的路径。

实现过程
CR-LSP备份技术的整个实现可以分为如下几个过程:
  1. 规划

    部署CR-LSP备份时的路径规划、带宽规划及部署方式表5-15
    表5-15  CR-LSP备份的部署
    部署子项

    热备份

    普通备份

    逃生路径

    路径

    可以通过配置指明是否允许主备路径部分重合。当备份CR-LSP使能显式路径建立时,以显式路径作为约束条件建立备份CR-LSP。

    热备份CR-LSP支持如下约束条件:

    无论备份CR-LSP是否用显式路径建立,备份CR-LSP的创建路径都可以与主CR-LSP的路径部分重合。

    普通备份CR-LSP支持如下约束条件:
    • 显式路径
    • 亲和属性
    • 跳数限制

    由隧道入节点自动计算得出。

    逃生路径支持如下约束条件:
    • 亲和属性
    • 跳数限制
    带宽

    默认情况热备份CR-LSP带宽与主CR-LSP带宽值相等。支持dynamic-bandwidth技术,以保证热备份CR-LSP不承载流量时不会额外占用带宽。

    带宽始终与主CR-LSP带宽值相等。

    逃生路径不会在路径上预留带宽,只具有路径保护能力。

    部署方式

    支持非LSP属性模板方式部署。

    支持非LSP属性模板方式部署。

    支持非LSP属性模板方式部署。

    支持LSP属性模板方式部署。

    支持LSP属性模板方式部署。

    不支持LSP属性模板方式部署。

    配置组合
    • 采用非LSP属性模板方式部署热备份CR-LSP,可以与逃生路径同时部署,共同保护主CR-LSP。

    • 采用LSP属性模板方式部署热备份CR-LSP,可以与普通备份、逃生路径同时部署,共同保护主CR-LSP。

    • 采用非LSP属性模板方式部署普通备份CR-LSP,只能单独作为备份路径保护主CR-LSP。

    • 采用LSP属性模板方式部署普通备份CR-LSP,可以与热备份CR-LSP、逃生路径同时部署,共同保护主CR-LSP。

    -

    表5-16  CR-LSP备份模式

    备份模式

    简要描述

    优点

    缺点

    热备份模式 系统在建立主CR-LSP的同时,会创建一条与主CR-LSP路径分离的备份CR-LSP。 流量切换速度快。 如果没有配置热备份CR-LSP动态带宽功能,则需要占用额外的带宽。
    普通备份模式 当主CR-LSP失效后,系统将使用其他显式路径建立CR-LSP。 无需占用额外的带宽。 流量切换速度不如热备份模式快。
    逃生路径模式 当主CR-LSP和备份CR-LSP都失效后,系统将使用剩余的路径建立逃生路径。 对路径建立的要求较为宽松,容易建立。 可能会降低某些QoS保证。
  2. 备份CR-LSP创建

    同一条隧道下可能存在多种建立备份CR-LSP的方式。在创建CR-LSP时,为了使隧道能够尽可能快速的承载业务,系统会轮流创建每种方式的备份CR-LSP,直到建立成功。

    CR-LSP的轮流创建规则如下:
    1. 当新提交一条隧道或者隧道状态变为Down时,系统将按一定的优先级顺序轮流尝试创建热备份CR-LSP、普通备份CR-LSP、逃生路径,直到隧道建立成功。
    2. 在创建热备份或者普通备份类型的CR-LSP时,用户可以在这两种CR-LSP下面最多配置三个CR-LSP配置模板,这些配置模板之间存在一定的优先级别,系统会按照优先级别从高到低轮流尝试创建各个配置模板,直到该CR-LSP建立成功。
    3. 如果使用的是低优先级的CR-LSP配置模板创建隧道成功,当链路状况发生改变时,系统将不断尝试向更高优先级的CR-LSP配置模板升级,即尝试用更高优先级的属性模板来创建备份CR-LSP。在升级过程中,系统将以Make-Before-Break机制创建新的CR-LSP保证流量不会中断。
    4. 如果备份CR-LSP下的三个属性模板都可以创建出稳定性较好的CR-LSP,则用户可以配置备份CR-LSP属性模板锁定功能。当配置了锁定功能以后,即使当前的备份CR-LSP使用的是一个低优先级属性模板,系统也不会去尝试更高优先级属性模板。这样可以减少很多不必要的流量切换,降低系统开销。

    用户可以根据需要进行备份模式的配置,交换机设备目前支持以下方式:
    • 热备份模式(手工配置)

    • 同时配置热备份模式(手工配置)和逃生路径

    • 热备份模式(使用属性模板配置)

    • 同时配置热备份模式(使用属性模板配置)和普通备份模式(使用属性模板配置)

    • 同时配置热备份模式(使用属性模板配置)和逃生路径

    • 同时配置热备份模式(使用属性模板配置)、普通备份模式(使用属性模板配置)和逃生路径

    • 普通备份模式(手工配置)

    • 普通备份模式(使用属性模板配置)

    • 同时配置普通备份模式(使用属性模板配置)和逃生路径

    • 逃生路径

  3. 备份CR-LSP的属性修改

    当用户修改了备份CR-LSP的约束条件时,入节点会触发重建备份CR-LSP。备份CR-LSP重建的过程采用了Make-Before-Break机制。当携带新属性的CR-LSP完全建立成功以后,如果此时备份CR-LSP已经承载了流量,MPLS TE隧道会将流量切换到新的CR-LSP上,然后删除原来的备份CR-LSP。

  4. 故障检测

    CR-LSP备份技术可以采用如下故障检测技术:
    • RSVP-TE的默认错误通告机制,但通常检测速度稍慢。
    • BFD for CR-LSP:可以对故障进行快速检测,推荐采用此种方式。
  5. 流量正切

    当隧道主CR-LSP发生故障后,入节点会触发流量从主CR-LSP向备份CR-LSP切换。其中切换的优先级顺序为热备份优先级最高,其次是普通备份,逃生路径优先级最低。

  6. 流量回切

    在备份CR-LSP承载流量的期间,流量会根据具体情况,按照一定优先级进行路径回切。其中主CR-LSP有最高优先级,其次是热备份CR-LSP,普通备份CR-LSP优先级最低

CR-LSP热备份dynamic-bandwidth保护机制

热备份CR-LSP可以配置dynamic-bandwidth保护,即动态带宽保护功能。在该功能下,在主CR-LSP出现故障之前,热备份CR-LSP并不会额外占用网络中的带宽资源(带宽值为0),只有当热备份CR-LSP真正承载流量后才会占用网络的带宽资源。这样可以更大幅度的节省网络资源,缩减网络开销。

使能动态带宽保护功能后,主CR-LSP承载流量,而热备份CR-LSP将不占用链路带宽。其具体过程为:
  1. 当主CR-LSP出现故障后,流量立即切换到带宽值为0的热备份CR-LSP,同时MPLS TE隧道入节点立即采用Make-Before-Break机制重建热备份CR-LSP。
  2. 当新的热备份CR-LSP建立成功后,流量就切换到新的CR-LSP上,同时将带宽值为0的热备份CR-LSP删除。
  3. 当主CR-LSP故障恢复后,流量会重新回切到主CR-LSP。此时热备份CR-LSP会释放已占用的带宽,重新采用0带宽建立热备份CR-LSP。
CR-LSP热备份Overlap-path功能

热备份CR-LSP可以配置Overlap-path功能,即在满足热备份CR-LSP的路径与主CR-LSP的路径尽量分离的情况下,支持部分重合,从而保证热备份CR-LSP对主CR-LSP的保护。

TE FRR

TE FRR能为MPLS TE隧道提供链路及节点的保护。当某处链路或节点故障时,流量会快速切换到备份路径,继续转发,从而最大程度上避免流量的丢失。

产生原因

通常情况下,MPLS TE隧道的链路或节点故障会引发隧道由主用路径向备份路径的切换。此切换过程涉及到IGP路由在备份路径的重新收敛、CSPF重新计算路径以及CR-LSP的重新建立,速度较慢,会导致流量的丢失。

TE FRR(Fast ReRoute)技术可以解决此问题。TE FRR会预先建立绕过故障的链路或者节点的旁路隧道,使得MPLS TE隧道链路或节点故障时独立于IGP协议的重收敛,快速切换到旁路隧道,避免流量丢失。在流量从旁路隧道传输的同时,MPLS TE隧道入节点会继续发起主CR-LSP的重建。

相关概念
图5-22  TE FRR局部保护示意图

针对图5-22所涉及的TE FRR的相关概念的解释如表5-17

表5-17  TE FRR中的概念

概念名称

说明

Primary CR-LSP

主CR-LSP,被保护的CR-LSP。

Bypass CR-LSP

保护主CR-LSP的CR-LSP。Bypass CR-LSP一般处于空闲状态,不独立承载业务。如果需要使用Bypass CR-LSP保护主CR-LSP的同时独立承载业务数据的转发,需要为Bypass CR-LSP分配足够的带宽。

PLR(Point of Local Repair)

本地修复节点。Bypass CR-LSP的入节点,必须在主CR-LSP的路径上,可以是主CR-LSP的入节点,但不能是主CR-LSP的出节点。

MP(Merge Point)

汇聚点。Bypass CR-LSP的出节点,必须在主CR-LSP的路径上,并且不能是主CR-LSP的入节点。

按照不同的分类标准TE FRR可分为以下几种类型,如表5-18
表5-18  TE FRR保护分类表

分类标准

类型

描述

保护对象

链路保护

图5-23中,PLR和MP之间由直连链路(LSRB→LSRC)连接,主CR-LSP经过这条链路。Bypass LSP 1可以保护该链路,称为链路保护。

节点保护

图5-23中,PLR和MP之间存在一台设备(LSRB→LSRC→LSRD),主CR-LSP经过该设备(LSRC)。Bypass LSP 2可以保护该节点,称为节点保护。

带宽保证

带宽保护

为Bypass CR-LSP配置大于等于主CR-LSP的带宽值,为主CR-LSP提供路径保护的同时提供带宽保护。

非带宽保护

不为Bypass CR-LSP配置带宽值,只能保证主CR-LSP的路径保护。

实现方式

手工方式

Bypass CR-LSP是由用户手工配置的,其与主CR-LSP的绑定关系也是由用户指定的。

自动(Auto)方式

Bypass CR-LSP是由使能了Auto FRR的节点自动建立的。只要经过该节点的主CR-LSP带有FRR保护请求,且拓扑结构满足FRR的拓扑结构,此节点就会自动为这条主CR-LSP建立Bypass CR-LSP并将两者绑定。

图5-23  TE FRR链路及节点保护示意图
说明:

对于一条已建立的旁路隧道,以上几种保护类型将以组合形式出现,比如:手工保护+节点保护+带宽保护,其他形式可依此类推。

实现过程

TE FRR的整个实现过程包括下面五个步骤:

  1. 主CR-LSP的建立

    主CR-LSP的建立过程与普通CR-LSP的建立过程一致,不同之处主要是:建立主CR-LSP过程中,隧道入节点会在Path消息的SESSION_ATTRIBUTE对象中添加相关标记。比如,局部保护标记用于标识主CR-LSP需要绑定Bypass CR-LSP,带宽保护标记则表示需要进行带宽保护。

  2. 绑定Bypass CR-LSP

    为主CR-LSP寻找合适的Bypass CR-LSP的过程称为绑定。只有具有局部保护标记的主CR-LSP才会触发绑定策略,绑定是在隧道切换之前完成的。

    实现绑定前,节点需根据Resv消息的RRO计算出Bypass CR-LSP的出接口、NHLFE、MP的LSR ID、MP分配的标签及保护的类型等信息。

    对于主LSP上的PLR节点而言,其下一跳(NHOP)或下下一跳(NNHOP)是已知的。如果Bypass CR-LSP的Egress LSR ID与NHOP的LSR ID相等,就可以形成链路保护;如果Bypass CR-LSP的Egress LSR ID与NNHOP的LSR ID相等,就可形成节点保护。如图5-24中的Bypass LSP 1和Bypass LSP 2,前者即为链路保护,后者即为节点保护。
    图5-24  TE FRR绑定旁路隧道示意图

    当同一个节点上有多条可用的Bypass CR-LSP时,主隧道将按照是否提供带宽保护→实现方式→保护对象这个顺序来进行旁路隧道的选择。其中,带宽保护优于非带宽保护,手工保护优于自动保护,节点保护优于链路保护。比如图5-24中的Bypass LSP 1和Bypass LSP 2,如果两者都能够提供带宽保护,且都为手工保护,则主LSP将选择Bypass LSP 2进行绑定。如果Bypass LSP 1能提供带宽保护,而Bypass LSP 2只能提供链路保护,则主LSP将选择Bypass LSP 1进行绑定。

    如果旁路隧道绑定成功,主CR-LSP的NHLFE表项中记录Bypass CR-LSP的NHLFE表项索引以及MP为上一个节点分配的标签,即内层标签。内层标签用于FRR切换时的流量转发。

  3. 故障检测

    • 链路保护直接使用链路层协议实现故障检测和通告,链路层发现故障的速度与链路类型直接相关。
    • 节点保护则使用链路协议检测链路故障,在链路没有故障的情况下,使用RSVP Hello机制或结合BFD for RSVP机制检测被保护节点的故障。
    一旦检测到链路故障或节点故障,就会同步触发FRR的流量切换。
    说明:
    • 对于节点保护,只保护被保护节点及其与PLR之间的链路。对于被保护节点和MP之间的链路故障,PLR无法感知。

    • 失效检测速度从高到低依次为链路故障检测、BFD检测和RSVP Hello检测。

  4. 切换

    切换是指主CR-LSP故障后,业务流量和RSVP消息从主CR-LSP切换到Bypass CR-LSP上,并向上游通告切换已经发生的过程。在切换的时候,会采用MPLS的标签嵌套机制,PLR节点会对数据报文先压入内层标签,再压入Bypass CR-LSP的下一节点为其分配的标签作为外层标签,Bypass CR-LSP会在倒数第二跳弹出外层标签,把只带有内层标签的报文传给MP,由于该内层标签原本就是MP分配给上一个节点的,因此MP能继续转发此报文给主CR-LSP的下一跳。

    例如,TE FRR切换前已经建立一条主CR-LSP和一条Bypass CR-LSP,其中主CR-LSP上各个节点分配的标签以及转发动作如图5-25所示。可见这里的Bypass CR-LSP形成了节点保护,如果LSRB和LSRC间的链路故障或者LSRC节点故障,都会触发流量向Bypass路径的切换。切换时,PLR节点LSRB将标签1024交换为MP节点为上一节点分配的标签1022作为内层标签,再压入Bypass CR-LSP的下一节点为PLR分配的标签34作为外层标签进行转发,以保证最终报文到达LSRD时仍能够继续转发给下一跳,具体转发流程请参见图5-25中的“TE FRR切换后的报文转发”。
    图5-25  TE FRR切换前后的报文转发示意图
  5. 回切

    切换后主CR-LSP的Ingress节点会试图重建主CR-LSP,并在主CR-LSP重建成功后,将业务流量和RSVP消息从Bypass CR-LSP回切到主CR-LSP上,其中尝试重建的CR-LSP称为Modified CR-LSP。此过程,TE FRR采用Make-Before-Break机制,即只有Modified CR-LSP建立成功后,原来的主CR-LSP才能被删除。

说明:

FRR不支持多点故障。如果发生了FRR切换,数据从主CR-LSP切换到Bypass CR-LSP,在数据通过Bypass CR-LSP转发期间,Bypass CR-LSP的状态必须始终保持UP。一旦Bypass CR-LSP在此期间出现故障,被保护的数据将不能通过MPLS转发,从而出现流量中断,FRR功能失效。即使Bypass CR-LSP重新建立,流量也无法转发,只能等待主CR-LSP恢复或重新创建后,流量才恢复转发。

其他功能
  • 拔板保护

    拔板保护是指当PLR节点的主CR-LSP物理出接口所在接口板被拔出时,将MPLS TE流量快速切换到旁路隧道上。当被拔出的接口板再次被插入时,如果主CR-LSP的物理出接口仍处于可用状态,可进行MPLS TE流量的回切。拔板保护主要是用来保护PLR节点上的主CR-LSP物理出接口。

    一般情况下,如果配置了隧道接口的接口板被拔出,隧道信息就丢失了。因此要实现TE FRR拔板保护,PLR的旁路隧道接口及Bypass CR-LSP的物理出接口都不能在被拔出的接口板上。一般情况,建议将PLR的旁路隧道接口配置在主控板上。

    将PLR的旁路隧道接口配置在主控板上后,当主CR-LSP物理出接口所在接口板被拔出或故障时,该接口就被置为Stale状态,经过该接口的有FRR保护的主CR-LSP保持不删除。当接口板重新插入时,恢复接口为可用状态,并开始重建主CR-LSP。

  • N:1保护

    TE FRR支持N:1的保护模式,即一条Bypass CR-LSP可以保护多条主CR-LSP。

CR-LSP备份与TE FRR共存
  1. CR-LSP备份与TE FRR联合部署

    • CR-LSP普通备份与TE FRR结合使用:TE FRR可以及时响应链路故障,将流量在最短的时间内切换到Bypass CR-LSP上。当主CR-LSP和Bypass CR-LSP都出现故障之后,才会建立备份CR-LSP并将流量切换到备份CR-LSP上。

    • CR-LSP热备份与TE FRR结合使用:TE FRR可以及时响应链路故障,将流量在最短的时间内切换到Bypass CR-LSP上,链路故障信息通过信令带到隧道入节点,然后将流量切换到备份CR-LSP上。

  2. CR-LSP备份与TE FRR同步联动

    当用户同时部署TE FRR的局部保护和备份CR-LSP的端到端保护之后,系统支持单独配置旁路保护隧道与备份CR-LSP同步联动的功能。当使能了CR-LSP备份同TE-FRR同步联动之后:

    • 如果配置的是普通备份

      当被保护链路或节点出现故障时,流量切换到TE FRR的Bypass CR-LSP并尝试恢复主CR-LSP,同时也会轮流尝试创建备份CR-LSP。

      当备份CR-LSP创建成功,并且主CR-LSP未恢复时,流量会切换到备份CR-LSP。

      当主CR-LSP恢复成功,则不管当前流量是处于Bypass CR-LSP还是备份CR-LSP,流量都会切换到新的主CR-LSP上。

      当备份CR-LSP创建不成功,且主CR-LSP恢复也不成功,流量仍然从Bypass CR-LSP通过。

    • 如果配置的是热备份

      当备份CR-LSP的状态为Up,且被保护链路或节点出现故障时,则流量先切换到Bypass CR-LSP后,立即切换到备份CR-LSP上,同时尝试恢复主CR-LSP。

      当备份CR-LSP的状态为Down,则处理方式与普通备份相同。

    当主CR-LSP处于Up状态的同时,热备份CR-LSP也会一直尝试创建,当创建成功,就会占用额外的带宽。而普通备份CR-LSP在主CR-LSP处于Frr-in-use状态时才开始创建,在主CR-LSP没有出现故障时,不需要占用额外的带宽资源。因此推荐选择普通备份的方式同TE FRR同步联动。

共享风险链路组

共享风险链路组SRLG(Shared Risk Link Group)主要用在CR-LSP热备份或TE FRR组网中作为备份隧道路径计算的限制条件,使得备份路径不与隧道主路径建立在具有同等风险等级的链路上,进一步增强TE隧道的可靠性。

产生原因

网络管理员通常会采用CR-LSP热备份或TE FRR技术来确保MPLS TE隧道的可靠性,但在实际的部署应用中,常会遇到保护失效的问题,下面以TE FRR为例介绍。

图5-26  SRLG示意图

图5-26所示,主CR-LSP路径为Path1,其中链路P1→P2需要TE FRR保护,Bypass CR-LSP的路径是Path2。

通常来说骨干网的核心节点(P1、P2、P3)之间都由传送网的设备连接,即图5-26中上图为组网的抽象拓扑,下图为实际的拓扑,其中NE1为传送网设备,在网络的组建和部署中往往会存在某些核心节点间共享了某段传送网链路的情况,比如图5-26中P1、P2和P3之间共享了标注为黄色的链路。如果共享的这段链路如果出现故障,会同时影响到主CR-LSP和Bypass CR-LSP,从而导致FRR保护失效。此时需要在建立Bypass CR-LSP时避过这种和主CR-LSP有共同风险的链路,以保证TE FRR能有效保护MPLS TE主隧道。这种技术就是SRLG。

SRLG是具有相同故障风险的一组链路集合,即如果其中一条链路失效,那么组内的其他链路也可能失效。这种情况下使用组内的其他链路作为失效链路的热备份CR-LSP或Bypass CR-LSP,将不能起到保护的作用。

实现过程

SRLG是一种链路属性,用数值表示,数值相同的链路表示属于同一个共享风险链路组。

SRLG是通过IGP TE来发布给整个MPLS TE域即相同域中的节点能够获取域内所有链路的SRLG信息。CSPF计算路径时,不仅会考虑带宽等约束条件,同时将SRLG作为约束条件来计算。

MPLS TE SRLG具有两种操作模式:

  • 严格SRLG模式(strict mode):对热备份CR-LSP和Bypass CR-LSP路径的计算,必须考虑SRLG的约束条件。

  • 首选SRLG模式(preferred mode):对热备份CR-LSP和Bypass CR-LSP计算路径时候可以不考虑SRLG的约束条件。如果第一次CSPF考虑SRLG约束计算备份路径失败,那么第二次进行算路的时候将不会考虑SRLG的约束条件。

适用场景

SRLG适用于应用了TE FRR和CR-LSP热备份技术的网络场景。

使用价值

部署SRLG可以约束热备份CR-LSP和Bypass CR-LSP路径的选择,避免了主、备路径建立在具有相同故障风险的链路上。

TE隧道保护组

隧道保护组能够为MPLS TE隧道提供端到端的路径保护能力,在主隧道发生故障时通过备份隧道较快的恢复数据流的传输。

相关概念

图5-27,隧道保护组中涉及如下概念:

  • 主隧道(Working tunnel):被保护的隧道。

  • 保护隧道(Protection tunnel):用来保护主隧道的隧道。

  • 保护倒换:在隧道保护组中,当主隧道发生故障时,数据流迅速倒换到备份隧道,从而提高网络可靠性。

图5-27  隧道保护组的原理图

图5-27,在入节点LSRA上指定主隧道tunnel-1的保护隧道为tunnel-3。根据配置的故障检测机制,当在入节点检测到tunnel-1隧道故障之后,则可以将流量切换到保护隧道tunnel-3上。而tunnel-1会一直尝试重建,如果建立成功,流量会根据配置的策略决定是否回切到主隧道上来。

实现过程

TE隧道保护组主要是通过预先的规划来提高主隧道的可靠性,所以在部署TE隧道保护组之前,需要对网络进行规划。为了能让保护隧道起到更好的保护作用,需要让保护隧道尽量不经过主隧道经过的链路和设备。

隧道保护组的具体实现流程,请参见表5-19

表5-19  隧道保护组实现流程

过程

描述

建立

主隧道和保护隧道必须具有相同的入节点和出节点,具体的隧道建立过程即为普通的TE隧道建立过程。其中,保护隧道的隧道属性可以不和主隧道一致。在部署隧道保护组时,需要尽量保证两条隧道的路径是分离的,以便让保护隧道起到更好的保护作用。
说明:
  • 在部署过程中,保护隧道不能被其它保护隧道嵌套保护,而且保护隧道也不能使能TE FRR。

  • 配置备份隧道时,可以单独配置自己的属性,这样更加利于用户规划网络。

绑定

主隧道启用了隧道保护组功能后,它会通过保护隧道的Tunnel ID将两者绑定为隧道保护组。

故障检测

除了MPLS TE的自身检测机制外,隧道保护组更多的采用MPLS OAM或者BFD for CR-LSP进行故障检测,以便做到快速的保护倒换。

保护倒换

隧道保护组的倒换方式包括两种:
  • 手动倒换:通过网络管理员手工执行命令,强制进行流量的切换。
  • 自动倒换:即主隧道检测到故障后自动进行流量的切换,不需人工干预。
其中,自动方式的保护倒换可以配置流量的切换时间。

回切

保护倒换完成之后,主隧道会一直尝试重建,如果建立成功,流量会根据配置的回切策略决定是否回切到主隧道。

1:1保护和N:1保护
隧道保护组支持1:1保护和N:1保护,即一条保护隧道既可以只保护一条隧道也可以保护多条隧道。
图5-28  N:1保护模式图

隧道保护组与CR-LSP备份的区别
CR-LSP备份和隧道保护组都是MPLS TE中的端到端的保护机制。这两种保护机制的主要区别请参见表5-20
表5-20  CR-LSP备份与隧道保护组的区别

比较内容

CR-LSP备份

隧道保护组

保护的对象

在同一条隧道中创建主、备两条CR-LSP。备份CR-LSP保护主CR-LSP。

保护组是用一个隧道保护另一个隧道。

TE FRR

主CR-LSP支持用TE FRR保护,备份CR-LSP不支持用TE FRR保护。

主隧道支持用TE FRR保护,备份隧道不支持用TE FRR保护。

LSP属性

主、备CR-LSP的属性(例如带宽,建立优先级,保持优先级)一致,除了TE FRR属性。

保护组内的各隧道的属性没有联系。例如,带宽为0的备份隧道可以保护有带宽保护要求的主隧道。

保护模式

支持1:1保护模式,即每条主CR-LSP都有自己的备份CR-LSP。

除了支持1:1保护模式,还支持N:1保护模式,即将一条隧道作为多条主用隧道的备份隧道,当任何一条主用隧道故障时,都将数据倒换到共享的备份隧道上。

BFD for MPLS TE

双向转发检测BFD(Bidirectional Forwarding Detection)可以对MPLS TE隧道进行快速故障检测,从而触发TE隧道可靠性功能进行流量切换,提高整网可靠性。

产生原因

MPLS TE经常采用TE FRR、CR-LSP备份或TE隧道保护组来提高网络的可靠性,但是这几种技术依靠RSVP Hello或者RSVP消息刷新超时等机制进行故障检测,检测速度缓慢。当节点间存在二层设备(比如交换机或HUB)时,触发流量保护倒换的速度将变慢,一定程度上引起流量的丢失。BFD检测机制可以很好的解决这个问题,它采用快速收发报文的机制,完成这些隧道链路故障的快速检测,从而引导承载的业务流量进行快速切换,达到保护业务的目的。

相关概念

根据BFD会话的建立方式,BFD可分为动态和静态两种。

  • 静态BFD:通过手工配置BFD的本地标识符和远端标识符。

  • 动态BFD会话:BFD的本地标识符和远端标识符由系统自动分配。

说明:

关于BFD的详细介绍请参见S9300, S9300E, S9300X V200R010C00 配置指南-可靠性》 BFD配置。

实现过程
MPLS TE中的BFD检测技术的按照检测对象的不同可分为三种:
  • BFD for RSVP

    BFD for RSVP是对RSVP的检测,可实现毫秒级故障监测时间,并配合RSVP协议快速的发现RSVP邻接故障。BFD for RSVP一般用在TE FRR中PLR节点与主路径的RSVP邻居之间存在二层设备的情况。

  • BFD for CR-LSP

    BFD for CR-LSP是对CR-LSP的检测,能够快速检测到CR-LSP的故障,并及时通知转发层面,从而保证流量的快速切换。BFD for CR-LSP通常与热备份CR-LSP或者隧道保护组配合使用。

  • BFD for TE Tunnel

    BFD for TE Tunnel用于MPLS TE隧道作为VPN的公网隧道时的场景。BFD for TE Tunnel使用BFD检测整条TE隧道,触发VPN FRR、VLL FRR等应用进行流量切换。

BFD for RSVP

当RSVP相邻节点之间存在二层设备时,这两个节点只能根据Hello机制感知链路故障,故障时间为秒级,这将导致数据大量丢失。

BFD for RSVP使用BFD检测RSVP邻居关系,BFD for RSVP可实现毫秒级故障监测时间,并配合RSVP协议快速的发现RSVP邻接故障。BFD for RSVP一般用在TE FRR中PLR节点与主路径的RSVP邻居之间存在二层设备的情况,如图5-29

图5-29  BFD for RSVP示意图

BFD for RSVP可以与BFD for OSPF、BFD for ISIS和BFD for BGP共享会话。共享BFD会话时,则本地节点分别选择所有共享BFD会话的协议的发送时间间隔、接收时间间隔、本地检测倍数的最小值做为本地的BFD会话参数。

BFD for CR-LSP

BFD for CR-LSP是对CR-LSP的检测,能够快速检测到CR-LSP的故障,并及时通知转发层面,从而保证流量的快速切换。BFD for CR-LSP通常与热备份CR-LSP或者隧道保护组配合使用。

BFD会话与CR-LSP绑定,即在入节点和出节点之间建立BFD会话。BFD报文从源端开始经过CR-LSP转发到达目的端,目的端再对该BFD报文进行回应,通过此方式在源端可以快速检测出CR-LSP所经过链路的状态。

当检测出链路故障以后,BFD将此信息上报给设备转发层面。转发层面查找备份CR-LSP,然后将业务流量切换到备份CR-LSP上。然后设备转发层面再将故障信息上报给控制层面,如果采用的是动态BFD for CR-LSP,控制层面会主动去创建备份CR-LSP的BFD会话。如果采用的是静态BFD for CR-LSP时且需要对备份CR-LSP进行检测,则可以为其配置BFD检测。

图5-30  链路故障前后BFD for CR-LSP示意图
BFD for TE Tunnel

BFD for TE Tunnel使用BFD检测整条TE隧道,从而触发VPN FRR等应用进行流量切换。

BFD for TE Tunnel与BFD for CR-LSP的区别是故障通告的对象不同。BFD for TE Tunnel是向VPN等应用通告故障,触发业务流在不同TE隧道接口上的切换;BFD for CR-LSP是向TE隧道通告故障,触发业务流在同一TE隧道内的不同CR-LSP上的切换。

三者区别
BFD for RSVP、BFD for CR-LSP以及BFD for TE Tunnel三者的区别可以参见表5-21
表5-21  BFD for TE中三种不同检测技术的比较

检测技术

检测对象

部署位置

适用场景

BFD会话方式的支持

BFD for RSVP

RSVP邻居关系

RSVP会话的两个邻居节点

与TE FRR联用

动态

BFD for CR-LSP

CR-LSP

隧道的首尾节点

与热备份CR-LSP或者隧道保护组联用

  • 动态
  • 静态

BFD for TE Tunnel

MPLS TE隧道

隧道的首尾节点

与VPN FRR或者VLL FRR联用

静态

RSVP GR

RSVP GR(Graceful Restart)可以保证节点故障后控制平面主备倒换时转发平面上的数据传输不会中断。

产生原因
图5-31,PE(Provider Edge)路由器是典型的GR应用场所,特别是用户单点接入骨干网的情况。当单点PE出现故障或者出于维护目的(比如升级软件版本)导致PE路由器发生主备倒换,此时如果部署了MPLS TE隧道来实施流量工程或者作为VPN公网隧道,则可以在类似PE3这样的单点接入设备上部署RSVP GR,给用户的关键业务提供不间断转发的高可靠性保障。
图5-31  RSVP GR应用场景图
相关概念

RSVP GR是RSVP-TE的一种快速状态恢复机制,属于高可靠性技术的一种,基于NSF(None Stop Forwarding)理念设计。

GR过程中有GR-Restarter和GR-Helper两种角色的路由器,GR-Restarter是指进行协议平滑重启,GR-Helper是指协助协议平滑重启。

RSVP GR主要有下面三种消息类型:
  • 带GR扩展的Hello消息:该消息用于检测邻居的GR状态。
  • GR Path消息:由上游节点发出,该消息携带有最后一次进行Path刷新消息的内容。
  • Recovery Path消息:由下游节点发出,该消息携带有下游节点最后一次收到的Path消息的内容。
实现过程

RSVP GR通过RSVP Hello扩展来检测邻居的GR状态。

RSVP GR的实现机制如下:

图5-32,GR-Restarter节点故障重启后,将停止向邻居节点发送Hello消息。使能了GR的邻居节点(GR-Helper)在连续3次未收到Hello消息后,认为邻居在做GR,所有的转发信息都将继续保持。同时接口板继续传输业务,并等待GR-Restarter节点进行GR恢复。

在GR-Restarter节点启动后,如果收到邻居的Hello消息,会向邻居节点发送Hello消息,处于隧道上游和下游的节点的处理方式是不一样的:

  • 上游的GR-Helper节点收到该消息后,向GR-Restarter节点(自己的下游)发出GR Path消息。

  • 下游的GR-Helper节点收到该消息后,向GR-Restarter节点(自己的上游)发出Recovery Path消息。

图5-32  RSVP GR示意图

当GR-Restarter节点收到GR Path消息和Recovery Path消息时,根据这两个消息重新建立CR-LSP相关的状态信息,这样本地控制层面信息就恢复了。

若下游支持节点不能发送Recovery Path消息,则本地状态仅通过GR Path消息来重建。

适用场景

采用RSVP-TE协议建立MPLS TE隧道承载业务时,可以部署RSVP GR来提高本节点的设备可靠性。

使用价值

保证故障节点控制层面主备倒换时,数据业务转发不间断,为MPLS TE节点提供设备级可靠性。

RSVP NSR

NSR(Non-Stop Routing)是NSF(Non-Stop Forwarding)技术的升级。当控制平面发生故障时,NSR能保证转发和控制平面的连接不中断,从而使邻居节点的控制平面感知不到本节点故障。

随着IP/MPLS在承载网、城域网应用越来越广泛,运营商对IP网络的可靠性要求也不断提高。NSR作为高可靠性的一种解决方案,越来越受到运营商的重视。

RSVP通过主备实时数据同步来实现NSR,它保证主备倒换后备板能够快速承载原主控板的业务,使邻居感知不到本设备故障。

RSVP实现了如下关键数据的主备实时同步:
  • 配置性数据。

  • 已经稳定建立的LSP状态块。

  • 关键性批量事件。

翻译
下载文档
更新时间:2019-08-20

文档编号:EDOC1000141521

浏览量:8738

下载量:344

平均得分:
本文档适用于这些产品
相关文档
相关版本
Share
上一页 下一页