如何处理存储链路速率过低导致主机虚拟机卡顿

发布时间:  2015-03-10 浏览次数:  317 下载次数:  1
问题描述
某局点一台主机上虚拟机均出现卡顿,而其他节点正常。
告警信息
FusionCompute V100R002 各版本暂无相关告警信息;
FusionCompute V100R003 各版本有网络接口速率监控和相关告警;
处理过程
通过重新插拔或更换网线后该网卡速率恢复到千兆,业务恢复。
根因
      主机与存储设备连接,多路径软件将主机IO根据一定算法下发到各条存储链路,最终写入存储设备。其主要作用是提高IO性能及链路冗余。

      华为多路径及linux通用多路径通常采用链路轮询方法(默认)下发IO,若某条存储链路因故中断,多路径软件会过滤掉该链路,但是当链路故障而未中断(速率降低),多路径仍然会对该链路下发IO,此时下发到该链路的IO因速率过低,导致整个主机的IO都会受到影响。

如:现网使用主机eth2、eth3与存储连接,通过排查主机侧、汇聚侧等接口速率发现该主机eth2网络协商速率仅为10Mb/s。

建议与总结
1、 项目交付时主机到存储之间的网络质量需要得到保障,否则影响虚拟机性能。

2、 FusionCompute V100R003各版本有网口速率告警,日常维护中需要及时关注并闭环。

END