阿里云 GPU 实例云服务器本地部署 DeepSeek R1

这篇博文记录一下使用阿里云 GPU 实例 ECS 基于 Ollama + Open WebUI 部署 DeepSeek R1 模型的过程。

选用的是阿里云 GPU 计算型 T4 加速型 ECS ，实例规格：ecs.gn6i-c8g1.2xlarge，CPU&内存：8核31G，GPU：NVIDIA T4，GPU显存：16G，操作系统：Ubuntu 24.04。

Ubuntu 安装 ollama

curl -fsSL https://ollama.ai/install.sh | sh

在安装过程中下面这个阶段停留时间比较长

Loading new nvidia-570.86.15 DKMS files...
Building for 6.8.0-51-generic
Building for architecture x86_64
Building initial module for 6.8.0-51-generic
EFI variables are not supported on this system
/sys/firmware/efi/efivars not found, aborting.

安装完成时的控制台输出

>>> NVIDIA GPU ready.
>>> The Ollama API is now available at 127.0.0.1:11434.
>>> Install complete. Run "ollama" from the command line.

curl 命令访问 11434 端口

curl 127.0.0.1:11434

得到下面的响应，说明 ollam 已正常运行

Ollama is running

我们这里部署 deepseek-r1 7b 模型，模型文件大小是4.7GB

拉取模型

ollama pull deepseek-r1:7b

但是经过多次尝试，这个 4.7G 的模型就是拉取不下来，详见博问 https://q.cnblogs.com/q/151681

后来几天尝试还是拉取不下来，看来不是临时性的网络问题，只能绕道而行，改为用 docker 拉取包含 deepseek-r1:7b 的 allama 镜像。

幸好 docker hub 上有现成的镜像 mazurkatarzyna/ollama-deepseek-r1-7b

docker pull mazurkatarzyna/ollama-deepseek-r1-7b:latest

然后用 docker compose 进行部署，docker compose 清单文件如下：

services:
  ollama:
    container_name: ollama
    pull_policy: if_not_present
    image: mazurkatarzyna/ollama-deepseek-r1-7b:latest 
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: 1
              capabilities:
                - gpu
    environment:
      OLLAMA_ORIGINS: "*"
      OLLAMA_HOST: "0.0.0.0"
  open-webui:
    image: ghcr.io/open-webui/open-webui:ollama
    container_name: open-webui
    volumes:
      - open-webui:/app/backend/data
    depends_on:
      - ollama
    ports:
      - 8080:8080
    environment:
      - 'ENABLE_OPENAI_API=False'
      - 'OLLAMA_BASE_URL=http://ollama:11434'
      - 'WEBUI_SECRET_KEY='
    extra_hosts:
      - host.docker.internal:host-gateway
volumes:
  open-webui: {}

docker compose 部署时出现下面的错误

Error response from daemon: could not select device driver "nvidia" with capabilities: [[gpu]]

需要通过下面的命令安装 NVIDIA Container Toolkit⁠

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey \
    | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list \
    | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' \
    | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit
sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker

安装之后 docker compose 部署成功，ollama 与 Open WebUI 容器成功启动。

通过 IP 地址访问服务器的 8080 端口就会看到 Open WebUI 的界面，创建账号后登录，就会看到默认选中了 deepseek-r1:7b，并且可以进行对话了。

部署就这么搞定了。

posted @ 2025-02-12 23:14 dudu 阅读(1103) 评论(1) 收藏举报

刷新页面返回顶部

阿里云 GPU 实例云服务器本地部署 DeepSeek R1

公告