Fork me on GitHub

AI上下文tokens对比

AI模型对比

模型名称 上下文窗口大小 (tokens) 主要用途与备注 免费/收费 (价格,约美元/百万tokens)
OpenAI GPT-4o 128,000 (128K) 通用,适合中等代码项目 收费 (输入 $5/M, 输出 $15/M)
OpenAI GPT-4.1 / GPT-5 1,000,000 (1M) 大型代码库、复杂推理 收费 (输入 $2-3/M, 输出 $8-12/M)
Anthropic Claude 3.5/4 Sonnet 200,000–1,000,000 (200K–1M,根据版本) 安全稳定、代码生成强;Claude 4 达1M 收费 (输入 $3-5/M, 输出 $15-20/M)
Google Gemini 1.5/2.5 Pro 1,000,000–2,000,000 (1M–2M,2.5 Pro即将2M) 超长上下文、多模态、整个仓库分析 收费 (输入 $2.5-3.5/M, 输出 $7.5-10.5/M)
xAI Grok 4 (标准) 256,000 (256K) 实时搜索、创意编程;主流版本 收费 (输入 $2-6/M, 输出 $8-15/M;有免费额度)
xAI Grok 4 Fast / Grok 4.1 Fast 2,000,000 (2M) 极速agent、长上下文稳定;当前最大之一 收费 (输入 $0.2/M, 输出 $0.5/M;极具性价比)
Meta Llama 3.1 / Llama 4 variants 128,000–10,000,000+ (128K–10M+,Scout实验达10M) 开源、本地部署、自定义强;部分变体超长 免费 (开源);API收费低
Baidu ERNIE 4.5 / Wenxin Yiyan 128,000 (128K) 中文强、多模态、推理好 免费基础;收费 (输入 $0.55/M, 输出 $2.2/M)
Alibaba Tongyi Qianwen (Qwen3-Max / Qwen3系列) 256,000–1,000,000+ (256K–1M+) 多语言、编程数学顶尖;Qwen3 系列长上下文优秀 免费 (开源);收费 (输入 $1.6/M, 输出 $6.4/M)
ByteDance Doubao 1.5 Pro 256,000 (256K) 高效MoE、低成本、长文档/代码代理 收费 (输入 $0.11/M, 输出 $0.275/M;促销更低)
Tencent Hunyuan (HY 2.0) 256,000 (256K) MoE、推理/代码强、边缘部署 免费小模型;收费企业约 $0.4-1.2/M
Huawei Pangu 5.5 128,000 (128K) 企业级、多模态、金融/工业强 收费 (Huawei Cloud自定义报价)
DeepSeek-V3 / V3.2 / R1系列 128,000 (128K,官方主流;API有时限64K,部分平台显示163K但实际可靠128K) 开源MoE王者、代码/数学/推理SOTA;长上下文针测试优秀,但>20-64K召回衰减明显 免费 (开源本地0成本);API极低 (输入 $0.07-0.55/M, 输出 $0.42-2.19/M;缓存省90%)

关键说明

缩写解释:128K = 128,000 tokens(约10万字英文或更多中文);1M = 1,000,000 tokens(约75万字);2M = 2,000,000 tokens。
有效性 vs 标称:许多模型标称1M+,但实际长上下文召回率(needle-in-haystack测试)因模型而异。Gemini和Grok在超长上下文更稳定,DeepSeek在中等长度(<64K)表现极稳。
写代码推荐:预算/中文/开源 → DeepSeek-V3 (128K);超大代码库/agent → Grok 4 Fast (2M) 或 Gemini 2.5 Pro (1M–2M)。

posted @ 2026-01-15 13:45  秋夜雨巷  阅读(1)  评论(0)    收藏  举报