GPUStack 离线部署镜像准备与国内加速源
在 GPUStack 的实际部署中,经常会遇到一个问题:
离线环境如何准备完整的镜像?
GPUStack 的核心服务镜像实际上只有一个:gpustack/gpustack。
无论是 Server 还是 Worker 节点,运行的都是这个主镜像。
但在模型推理时,GPUStack 会根据所使用的 GPU 类型、计算框架以及推理后端,自动拉取对应的 运行时镜像(Runner)。在在线环境中,这些镜像可以按需自动下载;而在 离线或内网环境 中,如果提前不知道需要哪些镜像,就可能在部署过程中反复补充镜像,影响部署效率。
为了解决这个问题,我们在官方文档中提供了一个网页工具:
GPUStack 容器镜像选择器(Container Image Selector)
通过简单的选项选择,就可以 动态生成所需的 GPUStack 镜像列表,方便提前准备离线部署所需的镜像。
打开 GPUStack 容器镜像选择器
打开 GPUStack 官方文档:
在顶部导航栏中,可以看到新增的 Container Image Selector 菜单。
桌面端界面:

移动端界面:

点击该菜单即可进入镜像选择工具,也可以直接访问:
https://docs.gpustack.ai/latest/image-selector/
进入 GPUStack 容器镜像选择器 页面。

切换中文界面
首次打开页面时默认是英文界面,可以在右上角语言菜单切换为 简体中文。

切换为中文后,还会显示 国内镜像源选项,方便在国内网络环境中准备镜像。

配置镜像选择条件
通过几个常见的部署参数,即可生成对应的镜像列表。
GPU 类型
默认选择 NVIDIA。

如果使用其他硬件平台,可以在这里进行选择。
计算框架版本
默认选择 最新版本。

昇腾计算框架版本区分芯片类型,同一框架版本在不同芯片上对应不同镜像,请根据实际芯片型号选择对应镜像。
例如:计算框架 CANN 8.5 根据芯片不同,分为 CANN 8.5 (910b)、CANN 8.5 (a3),以及 CANN 8.5 (310p)。
如图所示:

驱动版本要求说明
不同计算框架版本对底层驱动版本有明确要求。部署 GPU 推理环境时,需要确保驱动版本满足对应框架版本的最低要求,否则可能出现容器无法启动、GPU 无法识别或推理异常等问题。
下面以 NVIDIA CUDA 和 昇腾 CANN 为例说明常见版本的驱动要求。
NVIDIA CUDA 与驱动版本要求
| CUDA 版本 | 推荐驱动版本(Linux) |
|---|---|
| CUDA 12.9 | ≥ 575 |
| CUDA 12.8 | ≥ 570 |
| CUDA 12.6 | ≥ 560 |
说明:
- CUDA 程序运行需要兼容的 NVIDIA 驱动版本。
- 新版本驱动通常向下兼容旧 CUDA 版本。
昇腾 CANN 与驱动版本要求
| CANN 版本 | 推荐昇腾 NPU Driver |
|---|---|
| CANN 8.5 | 25.5.0 |
| CANN 8.3 | 25.3.0 |
| CANN 8.2 | 25.2.0 |
说明:
- 昇腾计算框架 CANN 需要匹配对应版本的 昇腾 NPU Driver。
- Driver 与 CANN 通常需要保持官方推荐组合,否则可能出现算子或运行时异常。
推理后端
推理后端按 最新版本排序。如果不选择,则默认显示全部可用后端。

目前内置推理后端包括例如:
- vLLM
- SGLang
- MindIE
- VoxBox
如果未找到所需的内置推理后端或对应版本,可以尝试 切换到较低版本的计算框架。一般来说,较高版本的 GPU 驱动能够兼容运行较低版本的计算框架。
可选镜像
默认使用 GPUStack 内置镜像。

服务器架构
服务器架构会根据硬件给出默认值:
- 昇腾 GPU:默认
ARM64 - 其他 GPU:默认
AMD64

如果服务器架构不同,也可以手动修改。
镜像源
默认镜像源为 Docker Hub。

在中文界面下,还可以选择 国内镜像源,用于加速镜像准备。
查看生成的镜像列表
根据所选择的条件,页面会 动态生成对应的镜像列表,并且提供了拆分后 Server 节点和 Worker 节点所需的镜像列表。

这些镜像就是在运行 GPUStack 与模型推理过程中需要使用的镜像。
对于离线部署环境,可以提前将这些镜像准备好并导入到目标环境中。
镜像准备参考命令
页面底部提供了 离线部署相关的镜像准备命令和文档说明。

小结
GPUStack 在运行时会根据模型和推理后端自动拉取运行时镜像。在在线环境中,这一过程通常是自动完成的;而在离线或内网环境中,提前准备所需镜像就变得十分重要。
GPUStack 容器镜像选择器提供了一种简单的方法:通过常见的部署参数组合,生成对应的镜像列表,帮助用户更清晰地了解需要准备哪些镜像,从而减少离线部署过程中反复补充镜像的情况。
工具地址:
https://docs.gpustack.ai/latest/image-selector/
🙌 加入 GPUStack 社区
如果你已经开始使用 GPUStack,
或者正在探索 本地大模型 / GPU 资源管理 / AI Infra,
欢迎加入我们的社区交流群,一起交流实践经验、踩坑记录与最佳方案。


浙公网安备 33010602011771号