Ollama 不使用 GPU 问题解决——基于 intel arc 显卡

1. 问题现象

部分同学在本地环境使用 Ollama 时,常发现模型运行时 GPU 占用率为 0 的情况,这种情况有两种现象
现象一:启动时显示算力为 CPU

启动时显示使用的算力为 CPU

现象二:加载大模型后(这里以 deepseek-r1:14b 为例),在任务管理器可以看到 GPU 使用率显示为 7%,这里的 7% 并非完全由大模型使用基本上可忽略不计

加载大模型后,任务管理其中 GPU 使用率显示为 7%

2. 解决方案

网上关于 GPU 不使用的解决方案很多,但大多都是 N 卡,关于 intel arc 显卡的解决方案少之又少,部分方案需要特别下载 Ollama 英特尔优化版,并执行某段脚本,该版本更新滞后,且较为繁琐。
但好在Ollama 0.12.11 通过 Vulkan 原生支持了 Intel GPUs,可通过环境变量的方式进行配置,献给出解决方案

  1. 首选确保自己的 Ollama 版本为最新版本,本机版本为 v0.17.5,使用 Scoop 管理安装

本机 Ollama 版本

  1. 增加系统环境变量 OLLAMA_VULKAN = 1

增加系统环境变量 OLLAMA_VULKAN = 1

3. 验证

重启启动终端,运行 Ollama
现象一:Ollama 开始使用显卡

可以看到 Ollama 已经开始使用我们的显卡了

现象二:加载大模型后(这里以 deepseek-r1:14b 为例),在任务管理器可以看到 GPU 使用率暴增

GPU 使用率暴增

posted @ 2026-03-05 18:46  张知非  阅读(28)  评论(0)    收藏  举报