FusionCompute 主机经常故障 一共6个主机,主机与VRM心跳异常

发布时间:  2017-04-28 浏览次数:  352 下载次数:  0
问题描述

FusionCompute  主机经常故障 一共6个主机,主机与VRM心跳异常
每台主机都出现过,随机出现,网络也排除过。E9000刀片  FusionComputeV100R005C10SPC700

告警信息


处理过程

根据问题现象,收集VRM和主机日志分析:


查看主机日志显示到VRM网络心跳异常,主机系统日志里未发现有网口状态变化,一直是联通状态。
而且主机的各个网卡流量不高。

VRM日志显示到主机网络不通,链接拒绝。



CAN日志显示到VRM网络不通,同时CAN的系统日志里打印收到大量不明报文,建议联系数通工程师排查网络。


后排查出为光交光模块的问题,更换光模块后问题解决

根因

光模块故障导致主机和VRM所在主机通信异常,产生告警,更换故障光模块后问题解决

解决方案

更换故障光模块后问题解决

建议与总结

网络问题经常导致主机和VRM链接性问题,工程师们要提高警惕。

END