虚拟化平台出现数据存储I/O延迟导致桌面虚拟机进入系统时间过长

发布时间:  2016-12-15 浏览次数:  112 下载次数:  0
问题描述
虚拟化平台出现数据存储延迟导致桌面虚拟机进入系统时间过长。
告警信息
处理过程

原有4个教师的220个虚拟机桌面都分配在S5300V3存储的一个lun上。

处理过程:

1、删除所有已发布的虚拟机。

2、将原有一个LUN分成4个LUN,同时分布到不同的控制器进行lun的均衡。

3、将原有链接克隆模版再克隆3个新模版出来,一个教师对应一个模版虚拟机,母模版也分配对应到存储的4个LUN上。

4、重新发布4个模版的虚拟机,最终4个模版虚拟机发布的虚拟机均衡分布在存储的4个lun上,到达lun归属控制器和存储链路均匀的目的。

5、重新发布后的虚拟机,观察一周后无数据存储I/O延迟告警。

根因
原有4个教师的220个虚拟机桌面都分配在S5300V3存储的一个lun上,在存储链路上和存储控制器上都没有均衡。
解决方案
将原有一个LUN分成4个LUN,同时分布到不同的控制器进行lun的均衡,如果桌面云虚拟机数量过大,建议分多个模版和多个存储lun进行发布。
建议与总结

1、桌面虚拟机尽量分布到不通的存储lun和控制器上。

2、存储如果是2个或多个端口绑定,需要在交换机上做成trunk模式,同时启用lacp。

如下为参考配置:

interface Eth-Trunk12
 description CNA02-storage
 port link-type trunk
 port trunk allow-pass vlan 2 to 4094
 mode lacp

3、网络设计上要合理,后端的链路带宽,和提供业务访问的带宽及中间如果有多个网络设备,带宽都需要评估和计算,是否能满足需求。

END