Tesla A100 40G OS下MMIOH资源不足
问题现象
2288H V5配置Tesla A100 40G时,Linux操作系统下执行lspci -vvv -s b9:00.0出现MMIOH资源不足问题,即回显中存在Region 1: Memory at <unassigned> (64-bit, prefetchable),如下图所示。
b9:00.0为Tesla A100 40G在操作系统下的bus总线地址,不同硬件配置下该bus总线地址可能不同。
解决方案
在BIOS Setup界面将MMIO High Granularity Size设置为256G及以上,详细操作步骤如下:
- 重启服务器并进入BIOS Setup界面。
- 依次进入Advanced > Socket Configuration > Common RefCode Configuration。
- 选择MMIO High Granularity Size,按Enter键,选择256G及以上,再按Enter键。
- 按“F10”。
弹出“Save Changes&Exit”对话框。
- 选择“Yes”并按“Enter”保存设置。
服务器将自动重启使参数生效。
- 在Linux操作系统下再次执行lspci -vvv -s b9:00.0,回显中Region 1可以正常分配地址空间,如下图示例中的Region 1: Memory at <eb000000000> (64-bit, prefetchable) [size=64G],其中eb000000000表示MMIO分配的起始地址,size=64G表示MMIO分配的地址空间大小。