FusionCompute 虚拟机卡死,ping的通,vnc登陆卡死

发布时间:  2017-05-04 浏览次数:  225 下载次数:  0
问题描述

用户有台redhat 6.4虚拟机网络能ping通,但是无法SSH登陆,VNC登陆后输入用户名后无响应。



处理过程

1.   查看虚拟机所在存储为44T,使用率达到了90%多,且簇大小为32KB

2.  目前的版本在这种情况下,当数据存储上新申请容量,需要遍历大量的块组描述符去寻满足要求的空闲空间,44T的容量最坏情况下需要遍历44*1024*1024(MB)/1024(MB)=45056个数据块,才能找到足要求的空闲空间,按每个io耗时5ms计算,要耗时225s,因此虚拟机内io会严重超时引起各种问题。

3.  查看虚拟机dump信息,虚拟机卡死确实因为文件相关操作超时(ext4_file_open)

4.    查看对应时间点主机上的日志,虚拟对应磁盘确认出现io卡住的情况(倒数第4列设备队列当中一直有io未处理,持续很长时间)。

5.综上信息分析是因为存储容量过大的情况下,且存储使用率过高,存储IO性能下降,导致虚拟机内一些io操作命令超时无法正常响应,虚拟机出现卡死现象。

 

 







 

 

 



根因

存储容量过大的情况下,且存储使用率过高,存储IO性能下降,导致虚拟机内一些io操作命令超时无法正常响应,虚拟机出现卡死现象。

解决方案



1.    将大于8T且使用率超过80%存储上的虚拟机迁移到存储使用率较低或者存储小于8T上面;

2.    对于新添加8T以上的数据存储将簇大小设置为1024KB



END