RH2485V2服务器,断电后系统异常报错

发布时间:  2015-11-30 浏览次数:  247 下载次数:  0
问题描述

某局点客户负责人电话联系工程师说服务器出现异常,情况为9台华为RH2485V2中的3台,断电后系统异常报错,严重影响业务运行。工程师上门查看后并未发现服务器硬件报错。怀疑操作系统层面问题。

告警信息

硬件无告警信息

处理过程

通过抓取所有服务器的系统日志分析时发现centos系统能正常进入系统是安装了系统自带的multipath多路径,无法进入系统的是华为UltraPath多路径。

       

multipath是通过WWN进行设备多路径聚合后生成新的设备名mpath*

UltraPath是聚合WWN聚合后使用sd*设备名

根因

在意外断电后,系统进行自检后,sd*设备名发生变化,自动挂载点找不到,发生文件系统无法自动修复。

解决方案

解决方法修改系统自动挂载文件/etc/fatab 用UUID替代sd*设备名

建议与总结

在以后实施过程中能用UUID挂载的,尽量避免使用/dev/sd*设备名挂载

END