所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级
案例库

在FusionSphere6.0环境下FusionComqute报错,VRM心跳故障

发布时间:  2017-11-24  |   浏览次数:  478  |   下载次数:  2  |   作者:  tjy  |   文档编号: EKB1001064512

目录

问题描述

在平台搭建完成后,在FusionSphere的状态检查下正常,各组件交互配置都是正确,虚拟机发放正常,业务也能正常运作,在局点运行一段时间后,FC及OM的监控页面上出现告警,告警为VRM心跳异常,并且此告警会定时清除,当系统自动清除告警后,每隔一段时间又会出现告警。

 

告警信息

此局点无网管平台,在机房检查控制、计算、存储节点以及交换机等链路接口正常,闪烁正常,网线接口以及光模块无故障。

处理过程

第一步:首先确认业务虚拟机运行正常,检查排除SC、OM、FC的问题,确认组件无误。

第二步:排查FusionSphere的配置是否有问题,IP配置等均为正确。

第三步:使用SSH登录CPS节点在节点内长ping FC、OM、SC等节点,发现有短暂丢包现象,如下:

compute09:/var/log/compute09/20171103/15/var/log # ping 10.1.26.30

PING 10.1.26.30 (10.1.26.30) 56(84) bytes of data.

From 10.1.26.69: icmp_seq=1 Destination Host Unreachable

From 10.1.26.69: icmp_seq=2 Destination Host Unreachable

From 10.1.26.69: icmp_seq=3 Destination Host Unreachable

64 bytes from 10.1.26.30: icmp_seq=4 ttl=64 time=7.65 ms

64 bytes from 10.1.26.30: icmp_seq=5 ttl=64 time=0.129 ms

64 bytes from 10.1.26.30: icmp_seq=6 ttl=64 time=0.135 ms

第四步:回到机房,检查链路网络等,确认交换机配置没有问题,链路是客户请的外包进行布线及链路安插。

第五步:经过最终检查得出是光纤接口、光模块并未插紧,在浪潮的服务器中,光模块需要使用较大的力气往服务器中插进,听到一声清脆的响声并确认无松动才算线路连接成功。

第六步:据此办法排查,浪潮服务器,交换机及各节点的模块及网线均未插紧,则我们手动一次插紧。

第七步:进行了上一步后,FC、OM、SC上均未出现VRM心跳故障告警信息。

根因

定位到由于在搭建云平台时,底层服务器、存储等为浪潮服务器,浪潮服务器的链路接口是相对华为的接口更加紧密,在部署光模块、网线等链路的时候需要确认链路是否为完全插紧,否则就会出现此类问题。

解决方案

在进行平台部署时,需留意各项细节,包括接口连线等,在初步搭建完成时就需要进行整体检查,避免在后续业务运作后再进行排错非常麻烦。