配置故障管理
用户可以使用故障管理提供的告警屏蔽、分发及抑制等功能,对系统进行故障管理配置。
应用环境
随着网络规模的扩大,网络复杂度随之提高,网络配置和应用的特性会越来越多。当设备某个模块发生故障的时候,可能会在一台或多台设备上产生大量的告警。由于设备侧以及网管侧处理告警的能力有限,会发生告警上报时丢失的情况,导致用户关注的某些告警无法获得,给网络管理带来不便。故障管理用于对设备产生的告警进行集中的动态管理和上报。
目前NE40E支持如下故障管理功能:
对重复告警、闪断告警、振荡告警等告警进行过滤抑制
屏蔽用户不关心的告警
查看告警配置信息、活动告警、历史告警和告警的统计数据,使用户更清楚地了解网络故障
对历史告警进行清除,避免之前的统计数据造成干扰
对告警进行模拟上报,验证主机与网络管理系统的配置是否正确、管理链路是否通畅
前置任务
在配置故障管理之前,需要完成以下任务:
路由器安装完毕并加电启动正常
已经存在告警的定义
配置告警项抑制周期
配置告警抑制开关
配置使用告警屏蔽表屏蔽告警功能
介绍编辑和应用屏蔽表的方法,以便于不同终端用户屏蔽不关心的告警。
背景信息
终端用户包括命令行用户、网管用户等,不同的终端用户关注的告警不同。终端用户通过设置告警屏蔽表,可以过滤自己不需要关注的告警。
通过配置告警屏蔽表,可以灵活设置屏蔽条件:
- 配置指定告警级别的告警屏蔽。如,屏蔽严重级别以下的告警。
- 配置指定功能特性的告警屏蔽。如,设置只关注MPLS业务的告警。
- 配置指定告警项的告警屏蔽。如,屏蔽LDP会话的告警。
不同的终端用户可以使用同一个屏蔽表,但是每个终端用户只能使用一个屏蔽表。
操作步骤
- 执行命令system-view,进入系统视图。
- 执行命令alarm,进入告警管理视图。
- 执行命令mask slot slot-id [ card card-id ],屏蔽指定单板或子卡的硬件告警。执行命令undo mask slot slot-id [ card card-id ],取消屏蔽指定单板或子卡的硬件告警。
- 执行命令mask name mask-name,进入屏蔽表视图。
- 可以选择如下一条或者几条命令屏蔽指定告警:
执行命令mask alarm-name alarm-name,屏蔽指定的告警项。
如果需要屏蔽多个告警项,可多次执行该命令。执行命令undo mask alarm-name alarm-name,则指定的告警项取消屏蔽。
执行命令mask feature-name feature-name,屏蔽指定业务的告警。
如果需要屏蔽多种业务的告警,可多次执行该命令。执行命令undo mask feature-name feature-name,则指定业务的告警取消屏蔽。
执行命令mask severity { Critical | Major | Minor | Warning },屏蔽指定级别的告警。
告警级别分为Critical、Major、Minor和Warning。如果需要屏蔽多个级别的告警,可多次执行该命令。执行命令undo mask severity { Critical | Major | Minor | Warning },则指定级别的告警取消屏蔽。
- 执行命令quit,退回告警管理视图。
- 请根据具体的终端用户类型和功能需求,选择执行如下命令屏蔽告警:
- 命令行用户使用terminal mask name mask-name命令来屏蔽指定告警上报功能。
- 主机名为host-name的网管用户使用snmp target-host host-name mask name mask-name命令来屏蔽指定告警上报功能。
- 执行命令commit,提交配置。