常见主流模型分类

通用含义:
Pro/Max/Expert,thinking/reasoner/reasoning/r-能力最强,思考时间长,也最贵,适合复杂任务;
Plus-效果平衡;
mini/Flash/Fast/Lite/air-适合简单任务,速度快;
nano-最小模型,处理及其简单的拼写、分类等轻量任务;
Coder/Codex/Code-工具调用,环境交互,编程用;
VL-视觉理解,文本外还可输入图像及视频;
Omni-全模态,文图音视;
instruct/chat-对话聊天;
preview-抢先版,最新,但可能不稳定;
oss- Open Source Software,开源模型
search/web-具备联网搜索能力
通用协议:
-
completions
-
出品方:openai
-
最古典、最通用、最主流的 llm 对话调用接口标准
-
-
messages
-
出品方:anthropic
-
首个和 openai 分庭抗礼的角色,就是要和 openai 不一样,尽管刚开始的时候接口字段相当接近,A\ 仍然选择搞一个独特的路由接口标准,但是现在又悄咪咪兼容了 completions 接口,claude code 大大提高了 messages 接口的流行度
-
-
responses
-
出品方:openai
-
openai 推行的面向 agent 的下一代 api 标准,内置工具、提供有状态上下文,Codex 专属接口,chat 转 codex 可使用 cpa 等工具,且性能可能有损失
-
-
X
- 烂中烂,包括但不限于 Google 等厂商把模型、api 参数嵌入 url 中的各种奇形怪状标准
国外部分:
-
1、Open AI
我想在座的各位无人不识Chatgpt:https://openai.com/api/
gpt-5.5,最新模型,处理最复杂的工作;
gpt-5.3-Codex,擅长agentic tasks,质量平衡,处理复杂开发任务;
gpt-5-mini,适合大多数编码
支持协议:completions,responses -
2、Claude
Anthropic公司: Plans & Pricing | Claude by Anthropic
claude-haiku-4-5-20251001,速度最快,轻量模型
claude-sonnet-4-6,体量适中,最平衡
claude-opus-4-7,处理最复杂逻辑推理
支持协议:messages,completions -
3、Grok
马斯克旗下xAI: Models and Pricing | xAI Docs
(除了图视音,官方强烈建议都用grok-4.3)
grok-4.3
grok-4.20-0309-reasoning
grok-4.20-0309-non-reasoning
支持协议:completions,responses -
4、Gemini
谷歌:https://ai.google.dev/gemini-api/docs/models
Gemini-3.1-Pro
Gemini-3-Flash
Gemini-3.1-Flash-Lite
支持协议:x,completions
国内部分:
-
1、Kimi
月之暗面: 模型列表 - Kimi API 开放平台
kimi-k2.6,coding模型,具备长程编码能力
moonshot-v1,简单文字任务
支持协议:completions,messages -
2、Qwen
阿里巴巴:通义实验室 | Qwen
B- Billion,前面数字越大,代表参数量越大,能力越强,越耗费算力。
例:小参数(8B,14B);中等参数(32B,72B);大型参数(110B)
Embedding-嵌入模型,非直接对话,目的是把输入内容转为计算机能理解的数字,常用语知识库检索语义相似度比对。
qwen3.6-max-preview
qwen3.6-plus
qwen3.6-flash
qwen3-coder-plus
支持协议:completions,messages,responses -
3、Deepseek
深度求索: 模型 & 价格 | DeepSeek API Docs
reasoner-深度思考,大量逻辑推导。编程用
deepseek-v4-pro
deepseek-v4-flash
注:现有的deepseek-chat 与 deepseek-reasoner 两个模型名将于日后弃用。出于兼容考虑,二者分别对应 deepseek-v4-flash 的非思考与思考模式。
支持协议:completions,messages -
4、GLM
智谱: 模型概览 - 智谱AI开放文档
glm-5.1,coding能力表示对齐Claude-opus-4.6
glm-5,coding能力表示对齐Claude-opus-4.5,擅长 Agentic 长程规划与执行
glm-4.7, 通用对话、推理与智能体能力升级
支持协议:completions,messages -
5、Minimax
上海稀宇科技:https://platform.minimaxi.com/docs/guides/models-intro#模型概览
MiniMax-M2.7,官方表示能自行构建复杂Agent Harness
MiniMax-M2.5
支持协议:completions,messages -
6、mimo
小米: Xiaomi MiMo API Open Platform
MiMo-V2.5
MiMo-V2
支持协议:completions,messages
浙公网安备 33010602011771号