桌面云产品创建虚拟机出现物理机内存不足故障

发布时间:  2015-07-17 浏览次数:  390 下载次数:  0
问题描述

项目场景如下:

1、软件版本:

Fusioncompute  V100R005C00SPC300
FusionAccess   V100R005C20SPC100

虚拟机类型:链接克隆、GPU直通

2、服务器型号:E9000 

    
刀片物理实际内存:96G

现象描述:

1、FusionComputer Portal上,在计算池集群点中任意刀片概要,查看到虚拟化域占用率总容量为77G,创建链接克隆虚拟机后,链接克隆虚拟机所在主机的虚拟化域占用率变成了65G,少了12G。每创建一个链接克隆虚拟机,该主机的虚拟化域占用率再减少12G。导致物理内存不足。

FusionComputer  portal上配置模板icahce 失败。

处理过程

1、刀片开启了SRIOV特性,在刀片上执行如下命令,如果屏显输出如下,表示刀片开启了SRIOV特性:



2、刀片安装CNA操作系统时,Dom0设置如下:



3、在刀片服务器上cat /boot/grub/menu.lst 查看icache值为16384M

4、开启SRIOV特性的刀片加入集群,必须关闭集群内存共享。使得虚拟机是独享内存

5、虽然刀片安装CNA操作系统的时候,icache设置了12288M,但是未起到作用。创建的链接克隆虚拟机消耗的依然是物理内存,导致物理主机内存不足。无法再多创建虚拟机。

根因

最终原因:物理主机开启SRIOV特性,跟icache配置互斥,导致配置的icache失效。

解决方案

修改mem_for_icache

1、首先登录刀片编辑menu

Vi  /boot/grub/menu.lst

找到如

dom0_mem=3072M mem_for_icache=16384M dom0_max_vcpus=2 dom0_reserve_vcpus=2

i字母键进行编辑

修改

mem_for_icache=16384Mmem_for_icache=4096M

修改完成后按ESC退出编辑模式

输入:wq进行保存退出

2、重启刀片服务器

3、在FusionComputer  portal上刷新刀片的虚拟化域占用率。对应值增加。

建议与总结
刀片开启SRIOV特性和icache是互斥的,建议刀片开启SRIOV特性的时候,将mem_for_icache修改为4096M。

END