常见主流模型分类

AI.png

通用含义:

Pro/Max/Expert,thinking/reasoner/reasoning/r-能力最强,思考时间长,也最贵,适合复杂任务;
Plus-效果平衡;
mini/Flash/Fast/Lite/air-适合简单任务,速度快;
nano-最小模型,处理及其简单的拼写、分类等轻量任务;
Coder/Codex/Code-工具调用,环境交互,编程用;
VL-视觉理解,文本外还可输入图像及视频;
Omni-全模态,文图音视;
instruct/chat-对话聊天;
preview-抢先版,最新,但可能不稳定;
oss- Open Source Software,开源模型
search/web-具备联网搜索能力


通用协议:

  • completions

    • 出品方:openai

    • 最古典、最通用、最主流的 llm 对话调用接口标准

  • messages

    • 出品方:anthropic

    • 首个和 openai 分庭抗礼的角色,就是要和 openai 不一样,尽管刚开始的时候接口字段相当接近,A\ 仍然选择搞一个独特的路由接口标准,但是现在又悄咪咪兼容了 completions 接口,claude code 大大提高了 messages 接口的流行度

  • responses

    • 出品方:openai

    • openai 推行的面向 agent 的下一代 api 标准,内置工具、提供有状态上下文,Codex 专属接口,chat 转 codex 可使用 cpa 等工具,且性能可能有损失

  • X

    • 烂中烂,包括但不限于 Google 等厂商把模型、api 参数嵌入 url 中的各种奇形怪状标准

国外部分:

  • 1、Open AI
    我想在座的各位无人不识Chatgpt:https://openai.com/api/
    gpt-5.5,最新模型,处理最复杂的工作;
    gpt-5.3-Codex,擅长agentic tasks,质量平衡,处理复杂开发任务;
    gpt-5-mini,适合大多数编码
    支持协议:completions,responses

  • 2、Claude
    Anthropic公司: Plans & Pricing | Claude by Anthropic
    claude-haiku-4-5-20251001,速度最快,轻量模型
    claude-sonnet-4-6,体量适中,最平衡
    claude-opus-4-7,处理最复杂逻辑推理
    支持协议:messages,completions

  • 3、Grok
    马斯克旗下xAI: Models and Pricing | xAI Docs
    (除了图视音,官方强烈建议都用grok-4.3)
    grok-4.3
    grok-4.20-0309-reasoning
    grok-4.20-0309-non-reasoning
    支持协议:completions,responses

  • 4、Gemini
    谷歌:https://ai.google.dev/gemini-api/docs/models
    Gemini-3.1-Pro
    Gemini-3-Flash
    Gemini-3.1-Flash-Lite
    支持协议:x,completions

国内部分:

  • 1、Kimi
    月之暗面: 模型列表 - Kimi API 开放平台
    kimi-k2.6,coding模型,具备长程编码能力
    moonshot-v1,简单文字任务
    支持协议:completions,messages

  • 2、Qwen
    阿里巴巴:通义实验室 | Qwen
    B- Billion,前面数字越大,代表参数量越大,能力越强,越耗费算力。
    例:小参数(8B,14B);中等参数(32B,72B);大型参数(110B)
    Embedding-嵌入模型,非直接对话,目的是把输入内容转为计算机能理解的数字,常用语知识库检索语义相似度比对。
    qwen3.6-max-preview
    qwen3.6-plus
    qwen3.6-flash
    qwen3-coder-plus
    支持协议:completions,messages,responses

  • 3、Deepseek
    深度求索: 模型 & 价格 | DeepSeek API Docs
    reasoner-深度思考,大量逻辑推导。编程用
    deepseek-v4-pro
    deepseek-v4-flash
    注:现有的deepseek-chat 与 deepseek-reasoner 两个模型名将于日后弃用。出于兼容考虑,二者分别对应 deepseek-v4-flash 的非思考与思考模式。
    支持协议:completions,messages

  • 4、GLM
    智谱: 模型概览 - 智谱AI开放文档
    glm-5.1,coding能力表示对齐Claude-opus-4.6
    glm-5,coding能力表示对齐Claude-opus-4.5,擅长 Agentic 长程规划与执行
    glm-4.7, 通用对话、推理与智能体能力升级
    支持协议:completions,messages

  • 5、Minimax
    上海稀宇科技:https://platform.minimaxi.com/docs/guides/models-intro#模型概览
    MiniMax-M2.7,官方表示能自行构建复杂Agent Harness
    MiniMax-M2.5
    支持协议:completions,messages

  • 6、mimo
    小米: Xiaomi MiMo API Open Platform
    MiMo-V2.5
    MiMo-V2
    支持协议:completions,messages

posted @ 2026-05-07 17:21  Simero  阅读(21)  评论(0)    收藏  举报