模块故障(VMware虚拟化)
现象描述
- 客户端“告警浏览”窗口的CGP网元下产生ALM-1003 模块故障告警。
- 客户端“模块管理”窗口,CGP或其他网元的模块的“模块状态及主备”为“故障”。
- 在客户端的“MML命令行 - CGP”窗口执行DSP MODULE命令,查询到模块的“可用状态”为“故障”或“NULL”。
定位思路
- 手工操作模块,如果用户正在执行复位、倒换等导致模块暂时故障的操作,请操作完成后,确认故障是否恢复。如故障恢复,则无需关注,如故障未恢复,请按照下述步骤恢复该故障。
- 模块异常终止或者虚拟机故障。
处理步骤
- 检查客户端“告警浏览”窗口是否产生ALM-1003 模块故障告警。
- 在客户端的“MML命令行 - CGP”窗口执行LST OPTLOG命令,查询“网元ID”为“0”的操作日志。
- 分析操作日志,查看是否执行过STP VM、STP MODULE或STP ME命令。
- 在客户端的“MML命令行 - CGP”窗口执行对应的启动命令STR VM、STR
MODULE或STR ME。等待5分钟,查看ALM-1003 模块故障告警是否恢复。
- 是 => 处理完毕
- 否 => 5
- 分析操作日志,查看是否执行过复位、倒换模块或虚拟机等导致模块暂时故障的操作。
- 等待相应的操作完成,查看ALM-1003 模块故障告警是否恢复。
- 是 => 处理完毕
- 否 => 7
- 请参见ALM-1003 模块故障进行处理。观察故障是否恢复。
- 是 => 处理完毕
- 否 => 8
检查是否手工操作过故障模块
模块或虚拟机故障处理