所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级
案例库

虚拟机在线迁移更换主机导致虚拟机宕机

发布时间:  2018-02-24  |   浏览次数:  250  |   下载次数:  0  |   作者:  13207159719  |   文档编号: EKB1001345302

目录

问题描述

1、在迁移前平台无任何告警,

2、迁移过程中也没有告警,没所有操作都是正常操作

3、显示迁移完成,并且没有任何告警

4、平台版本FusionComputeV100R006C10SPC101 标准版,使用共享存储。

告警信息

无任何告警,仅在最后验证业务的时候,业务宕机。系统中的服务未正常启动

处理过程

1、  排查虚拟机热迁移流程未发现异常情况。

2、排查源端日志,虚拟机于17:01:40被成功挂起;


3、  排查目的端日志,确认虚拟机于17:01:45migrating状态转为running状态

4、用户在FC portal对大存储虚拟机进行热迁移时,当内存数据快要迁移完成后,源端虚拟机会被suspend,然后目的端开始创建虚拟机,当挂盘、添加网卡等任务完成后,会将虚拟机状态从Migrating改为running,再销毁源端虚拟机;正常情况下当源端虚拟机suspend到目的端虚拟机变为运行中,耗时约为2~5秒。

5、排查libvirt日志,发现迁移过程中guestOS内部有crash,并发生重启。


根因

结论: Oracle linux使用的是centos 内核,热迁移过程中由于业务侧某种因素触发GustOS内部缺陷,导致迁移过程中GuestOS内部crash并发生重启。

解决方案

目前已知的Linux发行版本缺陷列表可通过发布的SIA中查看。

 

http://support.huawei.com/enterprise/zh/doc/DOC1000183124?idPath=7919749|7919788|9856606|21462752|19916941

并按照文档中的解决方案来处理。

建议与总结

在做Linux系统的迁移时要提前查看

FusionSphere SIA文档,已防止出现虚拟机重启。并在迁移过程结束之后要进行业务验证。