凝思麒麟系统安装达梦数据库 操作系统算法问题导致S5500T 存储数据传输速度慢

发布时间:  2016-02-15 浏览次数:  144 下载次数:  6
问题描述
某局点客户负责人电话联系工程师说新安装的华为S5500T V3存储数据传输速度慢。使用软件方的测试软件和dd命令测试,速度仅为21MB/S,速度表现不正常。本地拷贝数据时,可以达到300MB/S的正常速度。
告警信息

硬件无告警信息

处理过程

根据测试软件测试项目,在服务器段进行测试。

测 试1: 单并发dd测试,测试命令:dd if=/dev/zero of=/dmdata/test2 bs=8192 oflag=direct

测试情况:测试性能为21MB/s

测试结论:单并发dd透写由于受限于主机单并发机制,无法测试出存储的真实带宽 性 能,在iSCSI组网情况下,性能略低于FC表现,但属于正常范围。

测 试2: 多并发dd测 试(cfq模 式),测试命令:dd if=/dev/zero of=/dmdata/test2 bs=8192 oflag=direct

测试情况:启动4dd进程,总带宽无法增加,总带宽为22MB/s左右,

测试结论:多并发dd透写表现不正常,很明显存在瓶颈,瓶颈可能存在于:主机HBA卡配置或操作系统块设备层。

 

测 试3: 多并发dd测 试(noop模 式),测试命令:dd if=/dev/zero of=/dmdata/test2 bs=8192 oflag=direct

测试情况:调整主机块设备层的调度算法为noop模式

调整后,使用多并发dd测试,在启动13dd进程后,总写带宽达到了108MB/s ,已经基本达到GE链路理论上限。

测试结论: 存储并非整个测试的瓶颈,瓶颈在 于主机默认块设备层调度算法不合理导致。建议将该 系列操作系统的块设备层调度算法都改为noop模式

其他问题:在该版本凝思操作系统上,使用iostat查看,发现该程序显示异常,如下图标红处,明显超出正常范围。 可见 该操作系统是经过改动的,并可能存在一些其他未知问题,再出现问题时建议先由操作系统 层进行分析。

根因
电力系统部的多个局点均使用了凝思磐石的系统,该系统默认采取的块设备调度算法是cfq模式,该模式下无法有效的将IO下发至存储,将会导致在主机侧产生瓶颈(此时存储仍然非常空闲),我们在实验室和局点对该模式进行了大量的对比测试,确认了华为存储和凝思磐石系统的最优配置:在操作系统块设备调度算法修改为noop模式,将能够有效提高操作系统的IO效率。
解决方案
将操作系统块设备调度算法修改为NOOP模式
建议与总结
针对麒麟linux系统连接存储的环境,建议将操作系统块设备调度算法修改为noop模式。

END