所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

FusionCloud 6.3.1 用户指南 (Region Type II) 10

评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
GPU使用指南

GPU使用指南

概述

本章节通过步骤教程,教您搭建GPU产品的环境,并演示如何使用GPU节点来部署容器应用。目前版本只支持创建的虚机系统为华为欧拉操作系统,其他官方开源发布的操作系统不支持跑容器应用。

通过创建DaemonSet自动安装NVIDIA和CUDA驱动

概述

本章介绍如何按步骤创建DaemonSet来自动为纳管的GPU节点安装NVIDIA和CUDA驱动,为您能正常使用GPU功能做必要的铺垫。

上传软件

创建DaemonSet守护进程之前,用户需要将NVIDIA驱动等相关的软件上传到软件仓库。

前提条件
操作步骤
  1. 创建仓库空间

    1. 在主菜单中选择“云市场 > 软件中心 > 仓库空间管理”。
    2. 在左侧页面中,单击“创建仓库空间”。
    3. 输入仓库空间名称,如GPU-DRIVER,单击“确认”。
    4. 在右侧页面中,选择对应的仓库空间,勾选租户内共享

  2. 创建软件仓库。

    1. 在主菜单中选择“云市场 > 软件中心 > 软件仓库”。
    2. 在左侧页面中,单击“创建软件仓库”。
    3. 选择1.c中创建的仓库空间,输入仓库名称,如GPU,单击下一步。
    4. 选择添加软件包,输入软件包名称,如gpu,单击“添加版本”,输入软件包版本,如“1.0”。
    5. 单击“创建”。

  3. 上传软件。

    1. 在软件仓库选择软件的软件仓库,如2.c中的GPU。
    2. 单击下拉框,选择软件包版本,2.d中创建的1.0。
    3. 在页面右侧,单击“上传文件”。
    4. 单击“添加文件”或者将gpu_driver.zip拖入页面,单击“开始上传”,等待上传完成校验通过,单击“返回”。
    5. 在版本下的拉取地址一栏,单击复制仓库地址,记录仓库地址到本地。

创建DaemonSet
  1. 单击首页面“应用上线 > 应用管理”。
  2. 在页面左侧单击“创建应用”,选择“虚机应用”。
  3. 选择“守护进程应用”。
  4. 输入应用名称,如gpu-driver-install。
  5. 在页面下方单击下拉框。
  6. 在GPU策略一栏,选择支持GPU,并且选择相应GPU类型,一般选择所有类型,会对纳管的所有带GPU标签的节点安装GPU驱动,也可以只针对P4、P40、P100单独安装驱动。单击“下一步”。
  7. 在页面左侧单击,选择软件包。
  8. 在弹出小界面右上角搜索“kube-agent”,选择仓库空间为“default”的软件包,单击“下一步”。
  9. 选择文件名为“gpu_gcc_kernel”,单击“确定”。
  10. 在页面下面单击“安装”,输入“cd gpu_gcc_kernel;bash +x install.sh”到“安装脚本”栏。
  11. 在页面下面单击“环境变量”,单击,在“变量名称”输入“GPU_ADDR”,在“变量内容(变量值/变量引用)”输入上传软件3.e保存的仓库地址。
  12. 确认无误之后,单击“保存”>“下一步”。
  13. 发布为服务选择“否”。单击“下一步”。
  14. 在页面最下面单击“创建”。

创建GPU容器应用和虚机应用

前提条件
  • 创建应用前,请确保GPU资源节点充足,否则会创建失败。若资源不足,需要先添加节点,详情请参见添加数据资源
  • 创建应用前,请确保GPU资源节点已安装NVIDIA驱动,否则会创建失败。若未安装驱动,需要先安装,详情请参见通过创建DaemonSet自动安装NVIDIA和CUDA驱动
创建GPU容器应用

具体创建容器应用步骤请参考创建无状态容器应用创建有状态容器应用创建守护进程容器应用。如下关于创建GPU应用必选操作进行说明。

必选一:设置应用基本信息

  • 卷定义:GPU容器中需要使用NVIDIA和CUDA相关驱动和库。
    1. 需挂载卷,在卷定义下方单击设置,输入卷名称“nvidia”。
    2. 卷类型选择“HostPath”,单击,输入主机路径“/usr/local/nvidia”后确认。
    3. 同样操作,卷名称输入“cuda”,主机路径输入“/usr/local/cuda”。
  • GPU策略:支持GPU选择“是”,并选择对应GPU类型。

必选二:设置应用配置

  • GPU数据根据实际需要分配,容器应用会根据所需自动调度到符合要求的带GPU设备的节点上。
  • 设置容器数据卷
    1. 单击,在卷名称下拉栏中选择卷定义中的“nvidia”。
    2. 输入容器路径,推荐和虚机路径保持一致“/usr/local/nvidia”,确认。
    3. 同样操作,在卷名称下拉栏选择“cuda”,输入容器路径,推荐“/usr/local/cuda”,确认。
  • 设置容器应用环境变量,单击,输入变量名称“LD_LIBRARY_PATH”,变量值输入“/usr/local/nvidia/lib64:/usr/local/cuda/lib64”,确认。
创建GPU虚机应用

具体创建容器应用步骤请参考创建无状态虚机应用创建守护进程虚机应用,现在关于创建GPU虚机应用必选操作进行说明。

必选一:设置应用基本信息。

GPU策略:支持GPU选择“是”,并选择对应GPU类型。

必选二:设置应用配置。

GPU数据根据实际需要分配,虚机应用会根据所需自动调度到符合要求的带GPU设备的节点上。

翻译
下载文档
更新时间:2019-08-15

文档编号:EDOC1100043091

浏览量:44004

下载量:305

平均得分:
本文档适用于这些产品
相关文档
相关版本
Share
上一页 下一页