评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
计算单元
计算单元是AI Core中提供强大算力的核心单元,相当于AI Core的主力军。AI Core包含的计算单元如表2-4所示。
表2-4 计算单元介绍
计算单元 |
描述 |
---|---|
Cube |
Cube负责执行矩阵运算。
Cube支持的数据类型主要包含fp16,fp32,uint8,int8,int32等,不同的昇腾AI处理器版本支持的数据类型不同。 |
Vector |
Vector负责执行向量运算。 其算力低于Cube,但灵活度高于Cube(如支持数学中的求倒数,求平方根等),Vector所有计算的源数据以及目标数据都要求存储在Unified Buffer中,并要求32Byte对齐。 Vector覆盖各种基本的计算类型和许多定制的计算类型,主要包括fp16,fp32,int32,int8等,不同的昇腾AI处理器版本支持的数据类型不同。 |
Scalar |
Scalar负责各类型的标量数据运算和程序的流程控制。 功能上可以看做一个小CPU,完成整个程序的循环控制、分支判断、CUBE/Vector等指令的地址和参数计算以及基本的算术运算等。 |