所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

S9300, S9300E, S9300X V200R013C00 告警处理

本文档介绍了设备支持的告警,内容包含告警解释、告警属性、告警参数、告警原因、告警处理。
评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
BGP

BGP

BGP_1.3.6.1.2.1.15.7.1 bgpEstablished

告警解释

BGP/2/ESTABLISHED:OID [oid] The BGP FSM enters the Established state. (BgpPeerRemoteAddr=[BgpPeerRemoteAddrValue], BgpPeerLastError=[BgpPeerLastErrorValue], BgpPeerState=[BgpPeerStateValue])

当BGP的状态机进入Established状态时,那么该BGP的Established告警事件就会产生。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.2.1.15.7.1 Major communicationsAlarm(2)

告警参数

参数名称 参数含义

oid

该告警所对应的MIB节点的OID号。

BgpPeerRemoteAddr

对等体地址。

BgpPeerLastError

邻居上次断连时BGP Notification的错误码。

该参数显示格式是[ErrorCode][ErrorSubCode],其中[ErrorCode]是错误码,[ErrorSubCode]是错误子码。例如35,3代表错误码,5代表错误子码。错误码的具体含义请参见BGP错误码

该参数为0时,代表没有产生错误。

BgpPeerState

BGP peer的状态。
  • 1 Idle:BGP拒绝任何进入的连接请求,是BGP初始状态。

    当BGP收到开始事件后,BGP启动到对等体的TCP连接,启动连接重传定时器(ConnectRetry Timer),检测来自对等体的TCP消息,并且转移到Connect状态。

  • 2 Connect:此状态下,BGP等待TCP连接的建立完成后再决定后续操作。
    • 如果TCP连接建立成功,BGP将停止连接重传定时器(ConnectRetry Timer),然后发送一个Open消息给对等体,并且转移到Opensent状态。

    • 如果TCP连接建立失败,BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。

    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并再尝试与对等体建立TCP连接,此时BGP继续保持在Connect状态。

  • 3 Active:BGP将尝试进行TCP连接的建立,是BGP的中间状态。
    • 如果TCP连接建立成功,BGP将重置ConnectRetry Timer,然后发送一个Open消息给对等体,并且转移到Opensent状态。

    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并转移到Connect状态。

    • 如果BGP试图与一个未知的IP地址建立TCP会话,则TCP连接失败,连接重传定时器(ConnectRetry Timer)被重置,并且BGP保持在Active状态。

  • 4 OpenSent:此状态下,BGP等待对等体的Open消息。
    • 如果BGP收到正确的Open消息,则转移到OpenConfirm状态。

    • 如果BGP收到的Open消息有错误,则给对等体发送一个Notification消息,并且转移到Idle状态。

    • 如果BGP收到TCP连接断开消息,则BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。

  • 5 OpenConfirm:此状态下,BGP等待一个Notification消息或Keepalive消息。
    • 如果BGP收到Notification消息或者TCP连接断开消息,则转移到Idle状态。

    • 如果BGP收到Keepalive消息,则转移到Established状态。

  • 6 Established:BGP对等体间可以交换Update消息、Notification消息和Keepalive消息。
    • 如果BGP收到Update消息或Keepalive消息,则继续保持在Established状态。

    • 如果BGP收到Notification消息,将转移到Idle状态。

对系统的影响

BGP邻居正常建立。

可能原因

BGP邻居建立连接。

处理步骤

  1. 正常运行信息,无需处理。

BGP_1.3.6.1.2.1.15.7.2 bgpBackwardTransition

告警解释

BGP/2/BACKWARD:OID [oid] The BGP FSM moves from a higher numbered state to a lower numbered state. (BgpPeerRemoteAddr=[ipaddr], InstanceId=[gauge], Afi=[integer], Safi=[integer], PeerType=[integer], PeerRemoteAddr=[binary], InterfaceIndex=[integer], BgpPeerLastError=[octet], BgpPeerState=[integer], BgpPeerUnavaiReason=[gauge], InterfaceName=[octet])

当BGP状态机的状态值从高值状态变为低值状态并且前一个状态是Openconfirm状态或Established状态时,该bgpBackwardTransition告警事件就会产生。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.2.1.15.7.2 Major communicationsAlarm(2)

告警参数

参数名称 参数含义

oid

该告警所对应的MIB节点的OID号。

BgpPeerRemoteAddr

对等体地址。

InstanceId

实例ID

Afi

地址族

Safi

子地址族

PeerType

对等体类型

PeerRemoteAddr

对等体地址

InterfaceIndex

接口索引

BgpPeerLastError

这个邻居上次断连时BGP Notification的错误码。

该参数显示格式是[ErrorCode][ErrorSubCode],其中[ErrorCode]是错误码,[ErrorSubCode]是错误子码。例如35,3代表错误码,5代表错误子码。错误码的具体含义请参见BGP错误码

该参数为0时,代表没有产生错误。

BgpPeerState

BGP peer的状态。
  • 1 Idle:BGP拒绝任何进入的连接请求,是BGP初始状态。

    当BGP收到开始事件后,BGP启动到对等体的TCP连接,启动连接重传定时器(ConnectRetry Timer),检测来自对等体的TCP消息,并且转移到Connect状态。

  • 2 Connect:此状态下,BGP等待TCP连接的建立完成后再决定后续操作。
    • 如果TCP连接建立成功,BGP将停止连接重传定时器(ConnectRetry Timer),然后发送一个Open消息给对等体,并且转移到Opensent状态。

    • 如果TCP连接建立失败,BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。

    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并再尝试与对等体建立TCP连接,此时BGP继续保持在Connect状态。

  • 3 Active:BGP将尝试进行TCP连接的建立,是BGP的中间状态。
    • 如果TCP连接建立成功,BGP将重置ConnectRetry Timer,然后发送一个Open消息给对等体,并且转移到Opensent状态。

    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并转移到Connect状态。

    • 如果BGP试图与一个未知的IP地址建立TCP会话,则TCP连接失败,连接重传定时器(ConnectRetry Timer)被重置,并且BGP保持在Active状态。

  • 4 OpenSent:此状态下,BGP等待对等体的Open消息。
    • 如果BGP收到正确的Open消息,则转移到OpenConfirm状态。

    • 如果BGP收到的Open消息有错误,则给对等体发送一个Notification消息,并且转移到Idle状态。

    • 如果BGP收到TCP连接断开消息,则BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。

  • 5 OpenConfirm:此状态下,BGP等待一个Notification消息或Keepalive消息。
    • 如果BGP收到Notification消息或者TCP连接断开消息,则转移到Idle状态。

    • 如果BGP收到Keepalive消息,则转移到Established状态。

  • 6 Established:BGP对等体间可以交换Update消息、Notification消息和Keepalive消息。
    • 如果BGP收到Update消息或Keepalive消息,则继续保持在Established状态。

    • 如果BGP收到Notification消息,将转移到Idle状态。

BgpPeerUnavaiReason

对等体断连原因

  • 1 Configuration lead peer down:配置导致对等体断连。

  • 2 Receive notification:收到Notification报文。

  • 3 Receive error packet:收到错误报文内容。

  • 4 Hold timer expire:Hold定时器到时。

  • 5 Remote peer not reachable:远端对等体不可达。

  • 6 Direct connect-interface down:直连接口状态为Down。

  • 7 Route limit路由数达到上限。

InterfaceName

接口名称

对系统的影响

BGP邻居断连,撤销从邻居收来的BGP路由,基于BGP路由的报文转发失败。

可能原因

原因1:BGP Holdtimer超时并且没有收到Keepalive报文。

原因2:BGP收到错误的BGP协议报文。

原因3:BGP邻居重置,主动中断邻居。

原因4:BGP收到邻居的Notification报文。

处理步骤

  1. 使用display bgp peer ipv4-address log-info查看显示信息中的“Error”字段,可以看到收到的Notification信息中的Error Code和Sub Error Code,显示的格式是[ErrorCode][ErrorSubCode]。

    • 如果Notification的Error Code是1,表示BGP收到了报文头错误的报文,=>23。

    • 如果Notification的Error Code是2,表示BGP收到了错误的Open报文,=>23。

    • 如果Notification的Error Code是3,表示BGP收到了错误的Update报文,=>23。

    • 如果Notification的Error Code是4,表示BGP的Holdtimer超时也没有收到Keepalive报文,=>4。

    • 如果Notification的Error Code是5,表示BGP的有限状态机发生了错误,=>23。

    • 如果Notification的Error Code是6,=>2。

  2. Error Code值是6时表示BGP断连的原因是BGP主动关闭连接,使用display bgp peer ipv4-address log-info查看“Notification”字段,检查Notification是否是产生告警的交换机所发。

    • 如果显示“Send Notification”表示是本端交换机主动发送Notification的=>3。

    • 如果显示“Receive Notification”,表示本端交换机接收Notification=>22。

  3. 在用户日志中搜索命令reset bgp allreset bgp ipv4-address,检查日志本端是否有重置BGP,或者搜索命令peer ipv4-address enable,检查本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。

    • Y=>属于配置引起的告警,无需处理=>24。

    • N=>23。

  4. Error Code值是4表示是BGP断连的原因是HoldTimer超时,Ping BGP邻居的地址是否能通。

    • Y=>21。

    • N=>5。

  5. 使用命令display ip routing-table在“Destination/Mask”字段中查看是否有对端Peer地址的路由。

    • Y=>7。

    • N=>8。

  6. 使用命令display acl all命令可以查看交换机是否配置了禁止TCP端口179的ACL。

    • Y=>9。

    • N=>10。

  7. 使用命令display ip interface brief查看路由出接口对应的“Physical”和“Protocol”字段值是否是UP的。

    • Y=>23。

    • N=>11。

  8. 查看配置信息,检查BGP Peer地址的路由的来源。

    • 如果路由来源来自OSPF=>12。

    • 如果路由来源来自IS-IS=>13。

    • 否则=>23。

  9. 删除禁止TCP端口179的ACL。检查是否出现BGP_1.3.6.1.2.1.15.7.1 bgpEstablished告警信息。

    • Y=>24。

    • N=>10。

  10. 查看配置BGP邻居是否用Loopback接口建立连接。

    • Y=>14。

    • N=>15。

  11. 进入该接口的视图下,使用命令display this查看接口是否被shutdown了。

    • Y=>undo shutdown接口。

    • N=>22。

  12. 使用命令display ospf peer查看OSPF邻居是否建立。

  13. 使用命令display isis peer查看IS-IS邻居是否建立。

  14. 检查是否配置peer connect-interface指定源地址。

    • Y=>15。

    • N=>16。

  15. 如果BGP是EBGP邻居且EBGP邻居间有多跳,检查有没有配置peer ebgp-max-hop

    • Y=>17。

    • N=>19。

  16. 配置peer connect-interface命令。该命令的参数必须是与peer建立连接的本地接口。检查是否出现BGP_1.3.6.1.2.1.15.7.1 bgpEstablished告警信息。

    • Y=>24。

    • N=>23。

  17. 检查是否配置了peer valid-ttl-hops hops命令。

    • Y=>18。

    • N=>23。

  18. 检查到对端的报文的TTL是否在[255–hops+1, 255]的范围内。

    • Y=>23。

    • N=>20。

  19. 配置peer ebgp-max-hop。检查是否出现BGP_1.3.6.1.2.1.15.7.1 bgpEstablished告警信息。

    • Y=>24。

    • N=>23。

  20. 修改peer valid-ttl-hops hops的值,使之满足到对端的报文的TTL在[255–hops+1, 255]的范围内的判断条件。检查是否出现BGP_1.3.6.1.2.1.15.7.1 bgpEstablished告警信息。

    • Y=>24。

    • N=>23。

  21. 使用命令display cpu-usage查看CPU的利用率是否在一段时间内一直处于100%。

    • Y=>23。

    • N=>6。

  22. 联系对端设备的维护人员,检查对端交换机是否有重置BGP,或者本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。检查是否出现BGP_1.3.6.1.2.1.15.7.1 bgpEstablished告警信息。

    • Y=>24。

    • N=>23。

  23. 请收集告警信息和配置信息,并联系技术支持人员。
  24. 结束。

BGP_1.3.6.1.4.1.2011.5.25.177.1.3.1 hwBgpPeerRouteNumThresholdExceed

告警解释

BGP/2/ROUTETHRESHOLDEXCEED:OID [oid] The number of routes received from the BGP peer exceeded the alarm threshold. (InstanceId=[gauge], Afi=[integer], Safi=[integer], PeerType=[integer], PeerRemoteAddr=[binary], MaxRouteNum=[gauge], AlarmThreshold=[gauge])

从配置了路由限制命令的邻居收到的路由数量超过了告警门限值(MaxRouteNum×AlarmThreshold)。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.177.1.3.1 Major

qualityOfServiceAlarm(3)

告警参数

参数名称 参数含义

oid

该告警所对应的MIB节点的OID号。

InstanceId

邻居所在的实例索引。

Afi

地址族。包括:
  • 1: ipv4

  • 2: ipv6

  • 25: vpls

  • 196: l2vpn

Safi

子地址族。包括:
  • 1: unicast

  • 2: multicast

  • 4: mpls

  • 65: vpls

  • 128: vpn

PeerType

邻居地址类型。包括:
  • 1: ipv4

  • 2: ipv6

PeerRemoteAddr

邻居地址。

MaxRouteNum

对邻居配置路由限制的最大路由数。

AlarmThreshold

对邻居配置路由限制的告警门限百分比。

对系统的影响

  • 对于配置路由限制命令peer route-limit的告警门限参数为100%,且没有配置alert-only的邻居,会引起邻居连接中断,删除所有邻居收到的路由。

  • 对于配置其它参数的邻居,对系统没有影响。

可能原因

从配置了路由限制命令的邻居收到的路由数量超过了告警门限值。

处理步骤

  1. 使用命令display bgp peer ipv4-address verbose在“Received total routes”字段中查看当前从邻居收到的路由数量是否超过对邻居配置的最大路由数×告警门限(%)。

    • Y=>2。

    • N=>10。

  2. 确认路由数量超过门限值是否为实际应用需求。

    • Y=>8。

    • N=>3。

  3. 查看用户日志,是否曾修改本地入口策略,如配置命令peer route-policypeer ip-prefixpeer filter-policy,导致接收过多不必要的路由。

    • Y=>4。

    • N=>5。

  4. 更新本地入口策略,如配置命令peer route-policypeer ip-prefixpeer filter-policy,拒绝不必要的路由=>9。
  5. 联系对端设备维护人员,确认发布给本端的路由是否均为必要路由。

    • Y=>6。

    • N=>7。

  6. 请对端设备维护人员进行聚合处理,减少发布的路由数量=>9。
  7. 请对端设备维护人员更改引入路由或发布路由策略,撤销不必要的路由=>9。
  8. 请更改邻居的路由限制配置,增大可接收的最大路由数=>9。
  9. 检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.2 hwBgpPeerRouteNumThresholdClear告警信息。

    • Y=>11。

    • N=>10。

  10. 请收集告警信息和配置信息,并联系技术支持人员。
  11. 结束。

BGP_1.3.6.1.4.1.2011.5.25.177.1.3.2 hwBgpPeerRouteNumThresholdClear

告警解释

BGP/2/ROUTETHRESHOLDCLEAR:OID [oid] The number of routes received from the BGP peer decreased below the alarm threshold. (InstanceId=[gauge], Afi=[integer], Safi=[integer], PeerType=[integer], PeerRemoteAddr=[binary], MaxRouteNum=[gauge], AlarmThreshold=[gauge])

从配置了路由限制命令的邻居收到的路由数量降低到告警门限值(MaxRouteNum×AlarmThreshold)以下。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.177.1.3.2 Major

qualityOfServiceAlarm(3)

告警参数

参数名称 参数含义

oid

该告警所对应的MIB节点的OID号。

InstanceId

邻居所在的实例索引。

Afi

地址族。包括:
  • 1: ipv4

  • 2: ipv6

  • 25: vpls

  • 196: l2vpn

Safi

子地址族。包括:
  • 1: unicast

  • 2: multicast

  • 4: mpls

  • 65: vpls

  • 128: vpn

PeerType

邻居地址类型。包括:
  • 1: ipv4

  • 2: ipv6

PeerRemoteAddr

邻居地址。

MaxRouteNum

对邻居配置路由限制的最大路由数。

AlarmThreshold

对邻居配置路由限制的告警门限百分比。

对系统的影响

可能原因

从配置了路由限制命令的邻居收到的路由数量降低到告警门限值以下。

处理步骤

  1. 正常运行信息,无需处理。

BGP_1.3.6.1.4.1.2011.5.25.177.1.3.3 hwBgpPeerGRStatusChange

告警解释

BGP/3/GRSTATUSCHANGE:OID [oid] The graceful restart status of the BGP peer changed. (InstanceId=[gauge], Afi=[integer], Safi=[integer], PeerType=[integer], PeerRemoteAddr=[binary], GrStatus=[integer])

GR能力协商成功的BGP邻居,任何一端的GR状态发生变化。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.177.1.3.3

Minor

communicationsAlarm(2)

告警参数

参数名称 参数含义

oid

该告警所对应的MIB节点的OID号。

InstanceId

邻居所在的实例索引。

Afi

地址族。包括:
  • 1: ipv4

  • 2: ipv6

  • 25: vpls

  • 196: l2vpn

Safi

子地址族。包括:
  • 1: unicast

  • 2: multicast

  • 4: mpls

  • 65: vpls

  • 128: vpn

PeerType

邻居地址类型。包括:
  • 1: ipv4

  • 2: ipv6

PeerRemoteAddr

邻居地址。

GrStatus

邻居的GR状态。
  • 1: peerNotBeingHelped

  • 2: peerRestarting

  • 3: peerFinishRestart

  • 4: peerHelping

对系统的影响

  • peerNotBeingHelped(1)类型的告警产生时,无法在邻居重启过程中作为Helper端进行协助,业务暂时中断直至邻居重新建立并收敛所有路由。

  • peerRestarting(2)类型的告警产生时,检测到邻居发生重启,对于BGP路由迭代所依赖的路由协议有GR能力的业务无影响,BGP路由迭代的依赖路由协议没有GR能力的业务将中断。

  • peerFinishRestart(3)类型的告警为邻居恢复告警,对系统没有影响。

  • peerHelping(4)类型的告警产生时,本端已经发生GR倒换,对于BGP路由迭代所依赖的路由协议有GR能力的业务无影响,BGP路由迭代所依赖的路由协议没有GR能力的业务将中断。

可能原因

GR能力协商成功的BGP邻居,任何一端的GR状态发生变化。

处理步骤

  1. 根据参数GrStatus的取值进行处理。

    • peerNotBeingHelped(1),表示BGP邻居在重启过程中将不会被协助=>4。

    • peerRestarting(2),表示检测到BGP邻居进行了重启=>2。

    • peerFinishRestart(3),表示BGP邻居完成了最近一次的GR。邻居恢复告警信息,无需处理=>5。

    • peerHelping(4),表示BGP邻居在协助本端进行GR=>3。

  2. 使用display ip routing-table ipv4-address命令查看邻居地址是否存在。

    • Y,正在进行GR,不影响业务,无需处理=>5。

    • N=>4。

  3. GR已经进行主备倒换,请确认是否为本端主动进行的主备倒换。

    • Y=>5。

    • N=>4。

  4. 请收集告警信息和配置信息,并联系技术支持人员。
  5. 结束。

参考信息

BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished

告警解释

BGP/2/HWESTABLISHED:OID [oid] The BGP FSM enters the Established state. (InstanceId=[gauge], Afi=[integer], Safi=[integer], PeerType=[integer], PeerRemoteAddr=[binary], PeerLastError=[octet], PeerState=[integer])

当BGP的状态机进入Established状态时,那么该BGP的Established告警事件就会产生。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.177.1.3.9 Major communicationsAlarm(2)

告警参数

参数名称 参数含义

oid

该告警所对应的MIB节点的OID号。

InstanceId

邻居所在的实例索引。

Afi

地址族。包括:
  • 1: ipv4

  • 2: ipv6

  • 25: vpls

  • 196: l2vpn

Safi

子地址族。包括:
  • 1: unicast

  • 2: multicast

  • 4: mpls

  • 65: vpls

  • 128: vpn

PeerType

邻居地址类型。包括:
  • 1: ipv4

  • 2: ipv6

PeerRemoteAddr

对等体地址。

PeerLastError

邻居上次断连时BGP Notification的错误码。

该参数显示格式是[ErrorCode][ErrorSubCode],其中[ErrorCode]是错误码,[ErrorSubCode]是错误子码。例如35,3代表错误码,5代表错误子码。错误码的具体含义请参见BGP错误码

该参数为0时,代表没有产生错误。

PeerState

BGP peer的状态。
  • Idle:BGP拒绝任何进入的连接请求,是BGP初始状态。

    当BGP收到开始事件后,BGP启动到对等体的TCP连接,启动连接重传定时器(ConnectRetry Timer),检测来自对等体的TCP消息,并且转移到Connect状态。

  • Connect:此状态下,BGP等待TCP连接的建立完成后再决定后续操作。
    • 如果TCP连接建立成功,BGP将停止连接重传定时器(ConnectRetry Timer),然后发送一个Open消息给对等体,并且转移到Opensent状态。

    • 如果TCP连接建立失败,BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。

    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并再尝试与对等体建立TCP连接,此时BGP继续保持在Connect状态。

  • Active:BGP将尝试进行TCP连接的建立,是BGP的中间状态。
    • 如果TCP连接建立成功,BGP将重置ConnectRetry Timer,然后发送一个Open消息给对等体,并且转移到Opensent状态。

    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并转移到Connect状态。

    • 如果BGP试图与一个未知的IP地址建立TCP会话,则TCP连接失败,连接重传定时器(ConnectRetry Timer)被重置,并且BGP保持在Active状态。

  • OpenSent:此状态下,BGP等待对等体的Open消息。
    • 如果BGP收到正确的Open消息,则转移到OpenConfirm状态。

    • 如果BGP收到的Open消息有错误,则给对等体发送一个Notification消息,并且转移到Idle状态。

    • 如果BGP收到TCP连接断开消息,则BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。

  • OpenConfirm:此状态下,BGP等待一个Notification消息或Keepalive消息。
    • 如果BGP收到Notification消息或者TCP连接断开消息,则转移到Idle状态。

    • 如果BGP收到Keepalive消息,则转移到Established状态。

  • Established:BGP对等体间可以交换Update消息、Notification消息和Keepalive消息。
    • 如果BGP收到Update消息或Keepalive消息,则继续保持在Established状态。

    • 如果BGP收到Notification消息,将转移到Idle状态。

对系统的影响

BGP邻居正常建立。

可能原因

BGP邻居建立连接。

处理步骤

  1. 正常运行信息,无需处理。

BGP_1.3.6.1.4.1.2011.5.25.177.1.3.10 hwBgpPeerBackwardTransition

告警解释

BGP/2/HWBACKWARD:OID [oid] The BGP FSM moves from a higher numbered state to a lower numbered state. (InstanceId=[gauge], Afi=[integer], Safi=[integer], PeerType=[integer], PeerRemoteAddr=[binary], InterfaceIndex=[integer], PeerLastError=[octet], PeerState=[integer], PeerUnavaiReason=[gauge], InterfaceName=[octet])

当BGP状态机的状态值从高值状态变为低值状态并且前一个状态是Openconfirm状态或Established状态时,该hwBgpPeerBackwardTransition告警事件就会产生。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.177.1.3.10 Major communicationsAlarm(2)

告警参数

参数名称 参数含义

oid

该告警所对应的MIB节点的OID号。

InstanceId

邻居所在的实例索引。

Afi

地址族。包括:
  • 1: ipv4

  • 2: ipv6

  • 25: vpls

  • 196: l2vpn

Safi

子地址族。包括:
  • 1: unicast

  • 2: multicast

  • 4: mpls

  • 65: vpls

  • 128: vpn

PeerType

邻居地址类型。包括:
  • 1: ipv4

  • 2: ipv6

PeerRemoteAddr

邻居地址。

InterfaceIndex

接口索引。

PeerLastError

这个邻居上次断连时BGP Notification的错误码。

该参数显示格式是[ErrorCode][ErrorSubCode],其中[ErrorCode]是错误码,[ErrorSubCode]是错误子码。例如35,3代表错误码,5代表错误子码。错误码的具体含义请参见BGP错误码

该参数为0时,代表没有产生错误。

PeerState

BGP peer的状态。
  • 1 Idle:BGP拒绝任何进入的连接请求,是BGP初始状态。

    当BGP收到开始事件后,BGP启动到对等体的TCP连接,启动连接重传定时器(ConnectRetry Timer),检测来自对等体的TCP消息,并且转移到Connect状态。

  • 2 Connect:此状态下,BGP等待TCP连接的建立完成后再决定后续操作。
    • 如果TCP连接建立成功,BGP将停止连接重传定时器(ConnectRetry Timer),然后发送一个Open消息给对等体,并且转移到Opensent状态。

    • 如果TCP连接建立失败,BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。

    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并再尝试与对等体建立TCP连接,此时BGP继续保持在Connect状态。

  • 3 Active:BGP将尝试进行TCP连接的建立,是BGP的中间状态。
    • 如果TCP连接建立成功,BGP将重置ConnectRetry Timer,然后发送一个Open消息给对等体,并且转移到Opensent状态。

    • 如果ConnectRetry Timer超时,BGP将重新开始ConnectRetry Timer计时,并转移到Connect状态。

    • 如果BGP试图与一个未知的IP地址建立TCP会话,则TCP连接失败,连接重传定时器(ConnectRetry Timer)被重置,并且BGP保持在Active状态。

  • 4 OpenSent:此状态下,BGP等待对等体的Open消息。
    • 如果BGP收到正确的Open消息,则转移到OpenConfirm状态。

    • 如果BGP收到的Open消息有错误,则给对等体发送一个Notification消息,并且转移到Idle状态。

    • 如果BGP收到TCP连接断开消息,则BGP将重置ConnectRetry Timer,检测对等体发起的TCP连接,并且转移到Active状态。

  • 5 OpenConfirm:此状态下,BGP等待一个Notification消息或Keepalive消息。
    • 如果BGP收到Notification消息或者TCP连接断开消息,则转移到Idle状态。

    • 如果BGP收到Keepalive消息,则转移到Established状态。

  • 6 Established:BGP对等体间可以交换Update消息、Notification消息和Keepalive消息。
    • 如果BGP收到Update消息或Keepalive消息,则继续保持在Established状态。

    • 如果BGP收到Notification消息,将转移到Idle状态。

PeerUnavaiReason

对等体断连原因。

InterfaceName

接口名称。

对系统的影响

BGP邻居断连,撤销从邻居收来的BGP路由,基于BGP路由的报文转发失败。

可能原因

原因1:BGP Holdtimer超时并且没有收到Keepalive报文。

原因2:BGP收到错误的BGP协议报文。

原因3:BGP邻居重置,主动中断邻居。

原因4:BGP收到邻居的Notification报文。

处理步骤

  1. 使用display bgp peer ipv4-address log-info查看显示信息中的“Error”字段,可以看到收到的Notification信息中的Error Code和Sub Error Code,显示的格式是[ErrorCode][ErrorSubCode]。

    • 如果Notification的Error Code是1,表示BGP收到了报文头错误的报文,=>23。

    • 如果Notification的Error Code是2,表示BGP收到了错误的Open报文,=>23。

    • 如果Notification的Error Code是3,表示BGP收到了错误的Update报文,=>23。

    • 如果Notification的Error Code是4,表示BGP的Holdtimer超时也没有收到Keepalive报文,=>4。

    • 如果Notification的Error Code是5,表示BGP的有限状态机发生了错误,=>23。

    • 如果Notification的Error Code是6,=>2。

  2. Error Code值是6时表示BGP断连的原因是BGP主动关闭连接,使用display bgp peer ipv4-address log-info查看“Notification”字段,检查Notification是否是产生告警的交换机所发。

    • 如果显示“Send Notification”表示是本端交换机主动发送Notification的=>3。

    • 如果显示“Receive Notification”,表示本端交换机接收Notification=>22。

  3. 在用户日志中搜索命令reset bgp allreset bgp ipv4-address,检查日志本端是否有重置BGP,或者搜索命令peer ipv4-address enable,检查本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。

    • Y=>属于配置引起的告警,无需处理=>24。

    • N=>23。

  4. Error Code值是4表示是BGP断连的原因是HoldTimer超时,Ping BGP邻居的地址是否能通。

    • Y=>21。

    • N=>5。

  5. 使用命令display ip routing-table在“Destination/Mask”字段中查看是否有对端Peer地址的路由。

    • Y=>7。

    • N=>8。

  6. 使用命令display acl all命令可以查看交换机是否配置了禁止TCP端口179的ACL。

    • Y=>9。

    • N=>10。

  7. 使用命令display ip interface brief查看路由出接口对应的“Physical”和“Protocol”字段值是否是UP的。

    • Y=>23。

    • N=>11。

  8. 查看配置信息,检查BGP Peer地址的路由的来源。

    • 如果路由来源来自OSPF=>12。

    • 如果路由来源来自IS-IS=>13。

    • 否则=>23。

  9. 删除禁止TCP端口179的ACL。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>24。

    • N=>10。

  10. 查看配置BGP邻居是否用Loopback接口建立连接。

    • Y=>14。

    • N=>15。

  11. 进入该接口的视图下,使用命令display this查看接口是否被shutdown了。

    • Y=>undo shutdown接口。

    • N=>22。

  12. 使用命令display ospf peer查看OSPF邻居是否建立。

  13. 使用命令display isis peer查看IS-IS邻居是否建立。

  14. 检查是否配置peer connect-interface指定源地址。

    • Y=>15。

    • N=>16。

  15. 如果BGP是EBGP邻居且EBGP邻居间有多跳,检查有没有配置peer ebgp-max-hop

    • Y=>17。

    • N=>19。

  16. 配置peer connect-interface命令。该命令的参数必须是与peer建立连接的本地接口。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>24。

    • N=>23。

  17. 检查是否配置了peer valid-ttl-hops hops命令。

    • Y=>18。

    • N=>23。

  18. 检查到对端的报文的TTL是否在[255–hops+1, 255]的范围内。

    • Y=>23。

    • N=>20。

  19. 配置peer ebgp-max-hop。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>24。

    • N=>23。

  20. 修改peer valid-ttl-hops hops的值,使之满足到对端的报文的TTL在[255–hops+1, 255]的范围内的判断条件。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>24。

    • N=>23。

  21. 使用命令display cpu-usage查看CPU的利用率是否在一段时间内一直处于100%。

    • Y=>23。

    • N=>6。

  22. 联系对端设备的维护人员,检查对端交换机是否有重置BGP,或者本端是否在其它地址族下使能Peer,或者配置BGP连接参数等操作。检查是否出现BGP_1.3.6.1.4.1.2011.5.25.177.1.3.9 hwBgpPeerEstablished告警信息。

    • Y=>24。

    • N=>23。

  23. 请收集告警信息和配置信息,并联系技术支持人员。
  24. 结束。

BGP_1.3.6.1.4.1.2011.5.25.177.1.3.11 hwBgpRouteThresholdExceed

告警解释

BGP/3/HWBGPROUTETHRESHOLDEXCEED:OID [oid] The number of BGP routes exceeded the threshold. (RouteTypeIndex=[integer], CurrentRouteNumber=[integer], RouteThreshold=[integer], MaximumNumber=[integer])

BGP路由数量超过告警门限值。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.177.1.3.11 Minor

qualityOfServiceAlarm

告警参数

参数名称 参数含义

oid

该告警所对应的MIB节点的OID号。

RouteTypeIndex

BGP路由类型索引。
  • IPv4:IPv4路由,包括IPv4公网路由和IPv4私网路由
  • IPv4 Public:IPv4公网路由
  • IPv4 VRF:IPv4私网路由
  • IPv6:IPv6路由,包括IPv6公网路由和IPv6私网路由
  • IPv6 Public:IPv6公网路由
  • IPv6 VRF:IPv6私网路由
  • L2AD:BGP L2VPN-AD路由

CurrentRouteNumber

BGP某类型路由当前数量。

RouteThreshold

BGP某类型路由阈值上限。

MaximumNumber

BGP某类型路由最大值。

对系统的影响

对业务有潜在影响,即路由数量超过阈值上限输出告警,提示用户路由可能将要超过最大值而无法收到路由。

可能原因

BGP路由数量超过了路由阈值上限值。

处理步骤

  1. 检查配置、拓扑是否有误导致路由数量超过阈值上限值。

    • Y=>2。

    • N=>3。

  2. 进一步通过检查拓扑和用户日志,并修改错误配置和拓扑,从而避免接收到过量的路由。

    N=>4。

  3. 若是实际应用需求,确认是否需要扩容,联系技术支持人员
  4. 结束。

BGP_1.3.6.1.4.1.2011.5.25.177.1.3.12 hwBgpRouteThresholdClear

告警解释

BGP/3/HWBGPROUTETHRESHOLDCLEAR:OID [oid] The number of BGP routes decreased below the threshold. (RouteTypeIndex=[integer])

BGP路由数量降低到告警门限值以下。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.177.1.3.12

Minor

qualityOfServiceAlarm

告警参数

参数名称 参数含义

oid

该告警所对应的MIB节点的OID号。

RouteTypeIndex

BGP路由类型索引。

  • IPv4:IPv4路由,包括IPv4公网路由和IPv4私网路由
  • IPv4 Public:IPv4公网路由
  • IPv4 VRF:IPv4私网路由
  • IPv6:IPv6路由,包括IPv6公网路由和IPv6私网路由
  • IPv6 Public:IPv6公网路由
  • IPv6 VRF:IPv6私网路由
  • L2AD:BGP L2VPN-AD路由

对系统的影响

对于路由数量降低到阈值下限的路由输出恢复告警,对业务无影响。

可能原因

BGP路由数量降低到路由阈值下限值以下。

处理步骤

  1. 正常运行信息,无需处理。

BGP_1.3.6.1.4.1.2011.5.25.177.1.3.13 hwBgpRouteMaxExceed

告警解释

BGP/3/HWBGPROUTEMAXEXCEED:OID [oid] The number of BGP routes exceeded the maximum number. (RouteTypeIndex=[integer], MaximumNumber=[integer])

BGP路由数量超过告警最大值上限。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.177.1.3.13 Minor

qualityOfServiceAlarm

告警参数

参数名称 参数含义

oid

该告警所对应的MIB节点的OID号。

RouteTypeIndex

BGP路由类型索引。
  • IPv4:IPv4路由,包括IPv4公网路由和IPv4私网路由
  • IPv4 Public:IPv4公网路由
  • IPv4 VRF:IPv4私网路由
  • IPv6:IPv6路由,包括IPv6公网路由和IPv6私网路由
  • IPv6 Public:IPv6公网路由
  • IPv6 VRF:IPv6私网路由
  • L2AD:BGP L2VPN-AD路由

MaximumNumber

BGP某类型路由最大值。

对系统的影响

对业务有潜在影响,即路由数量超过最大值上限输出告警,提示用户BGP将无法接收更多路由。

可能原因

BGP路由数量超过了路由最大值。

处理步骤

  1. 检查配置、拓扑是否有误导致路由数量超过阈值上限值。

    • Y=>2。

    • N=>3。

  2. 进一步通过检查拓扑和用户日志,并修改错误配置和拓扑,从而避免接收到过量的路由。

    N=>4。

  3. 若是实际应用需求,确认是否需要扩容,联系技术支持人员
  4. 结束。

BGP_1.3.6.1.4.1.2011.5.25.177.1.3.14 hwBgpRouteMaxClear

告警解释

BGP/3/HWBGPROUTEMAXCLEAR:OID [oid] The number of BGP routes decreased below the maximum number. (RouteTypeIndex=[integer])

BGP路由数量降低到告警最大值下限。

告警属性

告警ID 告警级别 告警类型
1.3.6.1.4.1.2011.5.25.177.1.3.14

Minor

qualityOfServiceAlarm

告警参数

参数名称 参数含义

oid

该告警所对应的MIB节点的OID号。

RouteTypeIndex

BGP路由类型索引。

  • IPv4:IPv4路由,包括IPv4公网路由和IPv4私网路由
  • IPv4 Public:IPv4公网路由
  • IPv4 VRF:IPv4私网路由
  • IPv6:IPv6路由,包括IPv6公网路由和IPv6私网路由
  • IPv6 Public:IPv6公网路由
  • IPv6 VRF:IPv6私网路由
  • L2AD:BGP L2VPN-AD路由

对系统的影响

对于路由数量降低到最大值以下的路由输出恢复告警,对业务无影响。

可能原因

BGP路由数量降低到路由最大值以下。

处理步骤

  1. 正常运行信息,无需处理。

BGP错误码

错误码

错误子码

1:消息头错误

  • 1:连接未同步

  • 2:错误的消息长度

  • 3:错误的消息类型

2:Open消息错误

  • 1:不支持的版本号

  • 2:错误的对等AS

  • 3:错误的BGP标识符

  • 4:不支持的可选参数

  • 5:认证失败

  • 6:不可接受的保持时间

  • 7:不支持的能力

3:Update消息错误

  • 1:畸形属性列表

  • 2:不可识别的公认属性

  • 3:缺少公认属性

  • 4:属性标志错误

  • 5:属性长度错误

  • 6:无效Origin属性

  • 7:AS路由环路

  • 8:无效Next_Hop属性

  • 9:可选属性错误

  • 10:无效网络字段

  • 11:畸形AS_Path

4:Hold Timer溢出

0:没有特别的错误子码定义。

5:有限状态机错误

0:没有特别的错误子码定义。

6:终止

  • 1:前缀超过最大值。

  • 2:管理关闭

  • 3:删除邻居

  • 4:管理重置

  • 5:连接失败

  • 6:其他配置改变

  • 7:连接冲突

  • 8:资源短缺

  • 9:BFD断开连接

翻译
下载文档
更新时间:2019-04-09

文档编号:EDOC1100065982

浏览量:1261

下载量:47

平均得分:
本文档适用于这些产品
相关文档
相关版本
Share
上一页 下一页