VIMS域信息一致性检查不合格的误告警判断方法

发布时间:  2015-03-06 浏览次数:  204 下载次数:  2
问题描述
利用FusionCare对云平台进行巡检,巡检结果不合格项包括VIMS域信息一致性检查这一项。其中scsi-xxxx为异常的设备ID,异常设备为故障主机名称。
告警信息
处理过程
1. 使用ssh工具登录CNA节点,切换到root用户
2. 进入/sys/kernel/debug/o2dlm目录,可以看到几个以id命名的目录。



3. 进入到每个目录中,执行命令
cat dlm_state | grep 'Domain Map'
例如
linux-kDQWjx:/sys/kernel/debug/o2dlm/223A1A20D3A74FA2B0CA9E8648480060# cat dlm_state | grep 'Domain Map'
回显如下:
Domain Map: 5 6 9 10 
Exit Domain Map:
4. 如果不同CNA节点相同id的目录名称,domain map里的数字和个数相同,那么可以初步判断为误告警,否则确实是域信息不一致。需要收集日志进行进一步处理。
根因
• 系统存储在暂态数据存储,即有创建、解关联、销毁数据存储。
• 主机的配置文件可能被修改。
• 主机状态异常。

END