AMD
- 这里可以查询AMD显卡对应的参数
- 架构介绍
- RDNA: The all new RadeonTM gaming architecture powering “Navi”
- 驱动编译使用的LLVM target
rocprof
支持gfx1010rocgdb
对GPU architecture的标识hipcc
中的选项--offload-arch=<target>
,在github issue
- RoCM Developer Hub
- 书籍:Accelerated Computing with HIP
RDNA | LLVM target | Navi | |
---|---|---|---|
RX 5700/xt | 1.0 | gfx1010 | Navi10 |
- ROCM要求CPU和主板支持
PCIe™ atomics
,1st generation AMD Zen CPU and Intel™ Haswell 之后支持该操作。E5 2680v4是Haswell之后的Broadwell架构,理论上支持。 - ROCM对GPU支持列表:windows Linux
- 2023年11月12日,ROCM官网给出的GPU支持列表不包括RDNA1.0架构
- github issue, issue, issue提到可以用某个特定版本 RoCM5.2 来支持5700xt,尚未尝试。gihub issue失败例子。
pytorch 1.13.1
设置export HSA_OVERRIDE_GFX_VERSION=10.3.0
- 编译成功例子
- 知乎问题
尝试
- LXC配置
/var/lib/lxc/<lxc name>/config
访问显卡
- 这里有所有rocm的apt仓库版本,此处选择5.7.3,因为此处已经有人验证过该版本
- 也可使用
amdgpu-installer
进行安装
- 也可使用
echo "deb [arch=amd64 signed-by=/etc/apt/keyrings/rocm.gpg] https://repo.radeon.com/rocm/apt/5.7.3 jammy main" \
| sudo tee --append /etc/apt/sources.list.d/rocm.list
- pytorch 安装,命令参考, 编译的包的位置在
https://download.pytorch.org/whl/nightly/rocmx.x
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.7
检查
Linux无法正常启动,进入就会黑屏
- 设置VGA显示:在启动时按
ESC
进入GRUB界面,按E
选择对应的启动项编辑,在linux
开头行处加入nomodeset
参数,可以正常启动 - 进入系统后检查日志,
-b
参数后面数字可以选择是上一次失败的启动,-0
是本次启动,检查发现有报错amdgpu: smu driver if version not matched
,cannot find any crtcs or sizes
sudo journalctl -b -1 -p 7|grep amdgpu
- 最后发现是线缆没插紧,会导致Xorg无法正确返回屏幕大小,然后amdgpu驱动就会出错