所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

FusionCloud 6.3.1 用户指南 (Region Type II) 10

评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
GPU加速型云服务器配置方案

GPU加速型云服务器配置方案

简介

GPU加速型云服务器

GPU型云服务器能够提供优秀的浮点计算能力,从容应对高实时、高并发的海量计算场景。

GPU型云服务器包括图形加速型(G系列,虚拟化类型为Xen)和计算加速型(P系列,虚拟化类型为KVM)两类。其中:

  • G系列适合于3D动画渲染、CAD等。

    根据GPU为虚拟或硬直通,G系列又分为G1型与G2型。

  • P系列适合于深度学习,科学计算,CAE等。
应用场景
  • 应用

    深度学习、科学计算、CAE、3D动画渲染、CAD等。

  • 场景特点

    适合高实时、高并发的海量计算场景。

  • 适用场景
    • P系列用于人工智能:GPU包含上千个计算单元,在并行计算方面展示出强大的优势,P实例针对深度学习特殊优化,可在短时间内完成海量计算。
    • P系列用于科学计算:在科学计算领域,要求极强的双精度计算能力,在模拟仿真过程中,消耗大量计算资源的同时,会产生大量临时数据,对存储带宽与时延也有极高的要求。P系列可以满足这些需求。
    • G系列用于图形工作站:提供专业级CAD、视频渲染、图形处理所需的强大计算能力。
方案概述

本配置方案描述虚拟化类型为KVM(P系列)的计算加速型GPU云服务器完整的手动配置过程,具体的内容如下:

  1. 支持的GPU型号、操作系统信息请参见GPU加速型云服务器支持范围
  2. 如果需要扩容计算节点,参考扩容计算节点(可选)完成节点扩容及网络配置。
  3. 开启物理机上的GPU运行参数“intel_iommu”,重启物理机后配置生效。详细的操作步骤请参见开启运行参数“intel_iommu”
    说明:
    • 如果用FCD搭建环境时,已经规划了GPU加速型主机组,环境搭建完成后,该参数已经完成配置,无需执行此任务。
    • 修改intel_iommu的配置值后,物理机需要重启生效。如果物理机上有正在运行的云服务器或其他应用,请选择合适的时间点或将云服务器迁移后再重启,避免对您的业务造成影响。
  4. 主机组及规格的创建与标签配置。详细的操作步骤请参见创建GPU加速型主机组创建GPU加速型规格
  5. 创建镜像步骤参见制作镜像
  6. 创建弹性云服务器参见创建GPU加速型弹性云服务器

GPU加速型云服务器支持范围

GPU型号信息

GPU厂商为NVIDIA,vendor_id为0x10de。支持GPU型云服务器的GPU型号的详细信息如下表所示。

表14-56 GPU型号信息

GPU云服务器

GPU型号

product_id

接口类型

alias 名称

说明

PI1型弹性云服务器(计算加速)

NVIDIA Tesla P4

0x1bb3

PCIe 3.0

nvidia-p4

8G显存

PI2型弹性云服务器(计算加速)

NVIDIA Tesla P40

0x1b38

PCIe 3.0 Dual Slot

nvidia-p40

24G显存,2槽位

P1型弹性云服务器(计算加速)

Tesla P100 PCIe 12GB

0x15f7

PCIe 3.0

nvidia-p100-pcie-12

12G显存,2槽位

Tesla P100 PCIe 16GB

0x15f8

PCIe 3.0

nvidia-p100-pcie-16

16G显存,2槽位

P2型弹性云服务器(计算加速)

Tesla V100 PCIe 16GB

0x1db4

PCIe 3.0

nvidia-v100-pcie-16

16G显存,2槽位

Tesla V100 PCIe 32GB

0x1db6

PCIe 3.0

nvidia-v100-pcie-32

32G显存,2槽位

服务器及操作系统信息
服务器

支持的服务器包括:

  • RH2288H V3、2288H V5
  • E9000 CH220 V3
  • Atlas G2500、Atlas G530 V2、Atlas G560 V1
操作系统

KVM场景下,计算加速型GPU云服务器支持的常见操作系统信息如下:

  • PI1型云服务器
    • Ubuntu Server 14.04 64bit
    • CentOS 7.3 64bit
  • PI2型云服务器
    • Ubuntu Server 16.04 64bit
    • Debian 9.0 64bit
    • CentOS 7.4 64bit
    • EulerOS 2.2
    • Windows Server 2012 R2 64bit企业版
  • P1型云服务器
    • Debian 9.0 64bit
    • Ubuntu Server 16.04 64bit
    • Debian 8.0 64bit
    • CentOS 7.3 64bit
    • EulerOS 2.2 64bit
    • Windows Server 2012 R2 Standard 64bit
  • P2型云服务器
    • Ubuntu Server 16.04 64bit
    • EulerOS 2.2 64bit

更多服务器及操作系统信息请参考《FusionSphere SIA 华为客户机操作系统兼容性指南(KVM企业虚拟化) 01》

常见功能支持情况
GPU加速型云服务器常见功能支持范围如下表所示。
表14-57 常见功能支持情况

功能

是否支持

离线变更规格

在线变更规格

冷迁移

热迁移

HA

整机快照

克隆

CPU QoS

内存复用

创建前配置

扩容计算节点(可选)

如果需要扩容计算节点,请参考《FusionCloud 6.3.1.1 软件安装指南》“附录 > 安装过程中手工操作(非标准化部署方案)> 手动PXE方式扩容KVM计算节点”。

扩容后请参考《FusionCloud 6.3.1.1 软件安装指南》“附录 > 安装过程中手工操作(非标准化部署方案)> 手动调整网络配置”配置网络。

开启运行参数“intel_iommu”

创建GPU加速型云服务器前,需要将GPU插入计算节点物理主机,并确认GPU所在的所有物理主机“intel_iommu”配置为“on”,否则会导致云服务器下发失败。

前提条件
  • 已完成FusionSphere OpenStack计算节点主机的安装。
  • 已获取登录主机的IP地址、root用户密码。
  • 已将GPU设备插入计算节点物理主机。
操作步骤
  1. 登录ManageOne运维面,跳转至FusionSphere OpenStack安装部署界面(CPS),在概要界面查看计划用于创建GPU加速型云服务器的主机的“管理IP地址”。
  2. 使用PuTTY,通过主机的管理IP地址,登录主机。

    默认帐号:fsp,默认密码:Huawei@CLOUD8。

  3. 执行以下命令并输入root密码“Huawei@CLOUD8!”,切换到root用户。

    su - root

  1. 执行以下命令,防止系统超时退出。

    TMOUT=0

  1. 执行以下命令,查询当前单板是否存在GPU卡。

    lspci -n -D | grep 10de

  2. 执行以下命令,导入环境变量。

    source set_env

  1. 输入“1”,按“Enter”,并按提示输入“OS_USERNAME”的密码。

    默认密码:“FusionSphere123”。

  1. 执行以下命令,查看“intel_iommu”是否打开。

    cat /proc/cmdline |grep iommu

    回显类似如下信息:

    BOOT_IMAGE=/vmlinuz-3.10.0-327.55.58.94_14.x86_64 root=/dev/cpsVG/rootfs
    oops=panic net.ifnames=0 biosdevname=0 noexec=on 8250.nr_uarts=8 efi=old_map
    nmi_watchdog=1 intel_iommu=off selinux=0 pci=realloc console=tty0
    console=ttyS0,115200 nohz=off highres=on hpet=enable reserve_kbox_mem=16M
    crashkernel=334M@48M panic=3 crash_kexec_post_notifiers audit=0
    coredump_filter=0x33f elevator=cfq read_ahead_kb=512 hugepages=0 hugepagesz=2M
    default_hugepagesz=2M
    查看回显中“intel_iommu”的配置值:
    • on,任务结束。
    • off,执行步骤 9

  2. 在FusionSphere OpenStack安装部署界面,选择“配置 > 内核参数”,查看主机所在的主机组名称。例如:group2。如果主机不在任何主机组内,请单击右上角的“自动分组”或“手动分组”,将主机划分到某个主机组内。
  3. 依次执行以下命令,打开“intel_iommu”配置项。

    cps hostcfg-item-update --item kernel.boot --parameter iommu=pt intel_iommu=1 --type kernel 主机组名称

    cps commit

    主机组名称为步骤 9中获取的名称。

  4. 执行以下命令,重启物理主机,使配置生效。

    reboot

    说明:

    修改intel_iommu的配置值后,物理机需要重启生效。如果物理机上有正在运行的云服务器或其他应用,请选择合适的时间点或将云服务器迁移后再重启,避免对您的业务造成影响。

  1. 重复执行步骤 1步骤 11,完成所有待配置主机的参数确认与修改。
创建GPU加速型主机组
操作场景

主机组是虚拟化类型相同的一类主机的组合。本章节描述创建计算加速型GPU主机组并为主机组配置标签的操作。

为了方便管理,不影响后续的使用及维护,无论物理主机是否已加入其他主机组,均建议您创建新的主机组,将物理主机加入主机组,并配置主机组的标签。

操作步骤
  1. 使用浏览器,登录ManageOne运维面。

    • 登录地址:https://ManageOne运维面主页的访问地址:31943。例如,https://oc.type.com:31943。
    • 默认帐号:admin,默认密码:Huawei12#$。

  2. 在页面上方的导航栏,选择“运维地图”,进入“运维地图”页面。
  3. 在“运维地图”页面右边的“快速访问”导航栏中,单击“Service OM”,选择地域后进入Service OM界面。
  4. 选择“服务列表 > 计算 > 弹性云服务器 > 主机组”,进入“主机组”界面。
  5. 单击“创建”,填写主机组名称,选择可用分区,单击“保存”。

  1. 在新创建的主机组所在行,选择“更多 > 标签管理”。
  2. 在弹出的“标签管理”对话框中,资源类型选择“gpu”。

    如果需要启用GPU资源告警功能,则单击,设置“标签名称”和“标签值”分别为“hw:support_gpu_alarm”和“yes” ,单击“确定”。

  1. 在主机组所在行中,单击“主机管理”。

    在弹出对话框中勾选主机,单击“保存”,将所选主机加入主机组。

    说明:

    一台主机可以加入多个不同的主机组,但不能加入CPU复用比不同的主机组中。

创建GPU加速型规格

本章节描述创建计算加速型GPU云服务器的规格。

规格配比

计算加速型GPU云服务器推荐的规格配比如下,实际配置时,请根据使用需求配置。

类型

vCPU

内存(GB)

规格名称

GPU

PI1计算加速型云服务器

8

64

PI1.2xlarge.8

1×P4

16

128

PI1.4xlarge.8

2×P4

32

256

PI1.8xlarge.8

4×P4

PI2计算加速型云服务器

8

64

PI1.2xlarge.8

1×P40

16

128

PI1.4xlarge.8

2×P40

32

256

PI1.8xlarge.8

4×P40

P1计算加速型云服务器

8

64

P1.2xlarge.8

1×P100

16

128

P1.4xlarge.8

2×P100

32

256

P1.8xlarge.8

4×P100

P2计算加速型云服务器

8

64

P2.2xlarge.8

1×V100

16

128

P2.4xlarge.8

2×V100

32

256

P2.8xlarge.8

4×V100

操作步骤
  1. 使用浏览器,登录ManageOne运维面。

    • 登录地址:https://ManageOne运维面主页的访问地址:31943。例如,https://oc.type.com:31943。
    • 默认帐号:admin,默认密码:Huawei12#$。

  2. 在页面上方的导航栏,选择“运维地图”,进入“运维地图”页面。
  3. 在“运维地图”页面右边的“快速访问”导航栏中,单击“Service OM”,选择地域后进入Service OM界面。
  4. 在上方导航栏选择“服务列表 > 计算 > 弹性云服务器 > 规格”,进入“规格”界面。
  5. 单击“创建规格”,配置各项参数。
  6. 勾选标签,选择“KVM”,勾选“GPU加速型”。
  7. 根据GPU型号设置标签值后,单击“下一步”。

    • alias:GPU显卡的alias名称。
    • number:云服务器使用的GPU数量。

  1. 设置标签名称及可用分区,单击“确定”,完成规格创建。

制作镜像

参考制作KVM公共镜像章节制作镜像。

创建GPU加速型弹性云服务器

在ECS的申请界面上,云服务器类型选择“GPU加速型”,规格选择创建GPU加速型规格中创建的规格。

翻译
下载文档
更新时间:2019-08-15

文档编号:EDOC1100043091

浏览量:44851

下载量:307

平均得分:
本文档适用于这些产品
相关文档
相关版本
Share
上一页 下一页