目录
常用大模型 & 云部署步骤(精简 Markdown)
一、常用大模型(国内主流)
通用对话 / 代码
- 豆包(ByteDance)
- 通义千问(阿里)
- 文心一言(百度)
- 星火认知(科大讯飞)
- DeepSeek R1 / V3(深度求索)
- 混元(腾讯)
开源可私有化部署
- Llama 3 / Llama 2(Meta)
- Qwen 系列(阿里开源)
- ChatGLM3 / GLM-4(清华)
- Mistral / Mixtral
- DeepSeek-LLM
二、云部署通用步骤(以阿里云/华为云/腾讯云为例)
1. 准备工作
- 注册云厂商账号,完成实名认证
- 开通:ECS/云服务器 + 弹性公网 IP
- 选配置:GPU 机型(T4、A10、V100、A100 等)
2. 创建实例
- 选择镜像:Ubuntu 20.04 / 22.04
- 安全组开放:22(SSH)、80、443、8000 等端口
- 设置登录密码或密钥
3. 登录服务器 & 基础环境
# 更新系统
apt update && apt upgrade -y
# 安装 Python、pip、git
apt install python3-pip python3-dev git -y
# 安装 conda(可选)
wget ...
bash Anaconda3xxx.sh
4. 安装 GPU 驱动(如用 GPU)
- 云控制台一键安装 GPU 驱动
- 或手动安装 NVIDIA Driver + CUDA + cuDNN
5. 拉取模型 & 代码
git clone 项目仓库
# 下载模型(Hugging Face / ModelScope)
pip install modelscope transformers accelerate torch
6. 启动服务(API / WebUI)
# 启动 WebUI
python webui.py --listen
# 或启动 API 服务(FastAPI/Flask)
python main.py
7. 访问与测试
- 浏览器访问:http://公网IP:端口
- 用 Postman / curl 调用接口测试
8. 上线加固(可选)
- Nginx 反向代理
- HTTPS 证书配置
- 防火墙限制访问 IP
- 设置开机自启
三、极简一句话总结
- 买云 GPU 服务器
- 装 Python/CUDA 环境
- 拉模型代码
- 启动 Web/API 服务
- 公网访问使用
浙公网安备 33010602011771号