英伟达新一代GPU架构(50系列显卡)PyTorch兼容性解决方案
随着NVIDIA不断推出基于新架构的GPU产品,机器学习框架需要相应地更新以支持这些硬件。本文记录了在RTX 5070 Ti上运行PyTorch时遇到的CUDA兼容性问题,并详细分析了问题根源及其解决方案,以期为遇到类似情况的开发者提供参考。
在Anaconda虚拟环境("development")中使用VSCode进行开发时,将开发硬件更换为RTX 5070 Ti后,PyTorch运行时出现以下错误提示:
NVIDIA GeForce RTX 5070 Ti with CUDA capability sm_120 is not compatible with the current PyTorch installation.
The current PyTorch install supports CUDA capabilities sm_50 sm_60 sm_61 sm_70 sm_75 sm_80 sm_86 sm_90.
...
RuntimeError: CUDA error: no kernel image is available for execution on the device
经分析,问题的核心在于PyTorch稳定版的预编译二进制文件不支持sm_120计算能力。RTX 5070 Ti采用了较新的架构,需要更新的CUDA版本以及对应的PyTorch构建版本才能正常工作。
https://avoid.overfit.cn/post/2924df9d6e17436180bbbe799928e378