FusionCompute V100R005 主机关联的数据存储异常

发布时间:  2015-09-30 浏览次数:  182 下载次数:  0
问题描述

虚拟机发现被重启或者处于故障恢复中。在FusionCompute平台上发现CNA节点主机关联的数据存储有异常的告警。





告警信息

告警信息截图如下:


处理过程

先根据告警ID里面所建议的步骤检查,如:是否CNA节点与存储设备的网络连接故障等。然后再分析是否光纤交换机故障等其他外因所致。

1、首先登录存储设备检查是否存储设备异常;结果存储一切正常。

2、排查是否光纤交换机问题。从短时间内故障可以自行修复来看。有可能是由链路连接状态不良导致。处理方法可以登录到光纤交换机上查看端口误码是否正常



登陆SNS交换机,如上图所示,会发现SNS交换机上有一个端口crc err错误很多,可能会随着时间的增长而持续增加。

这种情况下,有可能是光模块出现问题或者光纤跳线接触不良导致

3、首先更换光模块,清除端口误码,观察端口误码是否还会持续增加。

    光纤交换机清除端口误码的方法如下:

    清除当前端口误码命令:statsClear  -uports 端口号

4、更换光模块后,发现端口误码依然在持续增加。这个时候更大的可能性就是跳线的问题了

5、更换跳线,观察端口误码不再持续增加。问题解决。


建议与总结

1、在告警比较多的情况下,建议首先将告警分类,有针对性的分类处理

   2、另外在光纤跳线部署方面上,务必遵守布线法则,规范部署光纤跳线,如:把光纤跳线与强电分离部署、跳线弯曲程度遵守跳线厂商的操作规范等。

END