Ollama【三、环境变量】

Ollama 环境变量(v0.1.30)详细说明

Ollama 环境变量用于配置服务地址、模型路径、GPU/内存、并发、日志等,以下是完整清单与用途说明(基于 v0.1.30+)。


一、核心基础配置(必知)

变量名 默认值 用途 示例
OLLAMA_HOST 127.0.0.1:11434 服务监听地址/端口;设 0.0.0.0:11434 允许局域网访问 0.0.0.0:8080
OLLAMA_MODELS 系统默认路径 自定义模型存储目录(解决C盘满) D:\ollama-models
OLLAMA_KEEP_ALIVE 5m 模型加载后在内存保留时长(避免频繁重载) 30m / 1h / -1(永久)
OLLAMA_DEBUG 0 开启调试日志(1=DEBUG,≥2=TRACE) 1
OLLAMA_ORIGINS 仅本地 允许跨域请求的域名(逗号分隔) https://app.com,https://dev.app.com

二、性能与并发(GPU/内存优化)

变量名 默认值 用途 示例
OLLAMA_NUM_PARALLEL 1 最大并行请求数(提升吞吐量) 4(8GB+显存)
OLLAMA_MAX_LOADED_MODELS GPU数×3 单GPU同时加载的最大模型数 2
OLLAMA_MAX_QUEUE 512 请求队列上限(超时报503) 1024
OLLAMA_GPU_OVERHEAD 0 预留显存(防OOM,单位字节) 2147483648(2GB)
OLLAMA_FLASH_ATTENTION true 启用Flash Attention(加速长文本) false(关闭)
OLLAMA_KV_CACHE_TYPE f16 KV缓存量化类型(f16/q4_0等) q4_0(省显存)
OLLAMA_SCHED_SPREAD false 强制模型跨所有GPU调度(多卡均衡) true
CUDA_VISIBLE_DEVICES 所有GPU 指定使用的NVIDIA GPU(索引) 0(仅用第一块)

三、模型与运行时管理

变量名 默认值 用途 示例
OLLAMA_NOPRUNE false 启动时不清理旧模型 blob(保留历史版本) true
OLLAMA_LLM_LIBRARY 自动 手动指定LLM推理库路径(高级) /path/to/libllama.so
OLLAMA_RUNNERS_DIR 内置 自定义 runners 目录(替换推理引擎) /path/to/runners
OLLAMA_TMPDIR 系统临时目录 临时文件存放路径(大模型解压用) /mnt/ssd/tmp

四、其他实用变量

变量名 默认值 用途 示例
OLLAMA_CONTEXT_LENGTH 4096 默认上下文窗口大小(未指定时生效) 8192
OLLAMA_NOHISTORY false 不保存对话历史(隐私模式) true

五、各系统设置方法

Linux(systemd 服务)

sudo systemctl edit ollama.service
# 添加
[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"
Environment="OLLAMA_MODELS=/data/ollama"
# 保存后
sudo systemctl daemon-reload
sudo systemctl restart ollama

macOS(App 模式)

launchctl setenv OLLAMA_HOST 0.0.0.0:11434
# 重启 Ollama App

Windows(系统环境变量)

  1. 此电脑 → 属性 → 高级系统设置 → 环境变量

  2. 新建系统变量:OLLAMA_MODELSD:\ollama-models

  3. 重启 Ollama 服务


六、快速查看所有变量

ollama serve --help

会列出当前版本所有环境变量与说明。

posted @ 2026-03-22 21:47  蓝迷梦  阅读(510)  评论(0)    收藏  举报