AI上下文tokens对比

AI模型对比

模型名称	上下文窗口大小 (tokens)	主要用途与备注	免费/收费 (价格，约美元/百万tokens)
OpenAI GPT-4o	128,000 (128K)	通用，适合中等代码项目	收费 (输入 $5/M, 输出 $15/M)
OpenAI GPT-4.1 / GPT-5	1,000,000 (1M)	大型代码库、复杂推理	收费 (输入 $2-3/M, 输出 $8-12/M)
Anthropic Claude 3.5/4 Sonnet	200,000–1,000,000 (200K–1M，根据版本)	安全稳定、代码生成强；Claude 4 达1M	收费 (输入 $3-5/M, 输出 $15-20/M)
Google Gemini 1.5/2.5 Pro	1,000,000–2,000,000 (1M–2M，2.5 Pro即将2M)	超长上下文、多模态、整个仓库分析	收费 (输入 $2.5-3.5/M, 输出 $7.5-10.5/M)
xAI Grok 4 (标准)	256,000 (256K)	实时搜索、创意编程；主流版本	收费 (输入 $2-6/M, 输出 $8-15/M；有免费额度)
xAI Grok 4 Fast / Grok 4.1 Fast	2,000,000 (2M)	极速agent、长上下文稳定；当前最大之一	收费 (输入 $0.2/M, 输出 $0.5/M；极具性价比)
Meta Llama 3.1 / Llama 4 variants	128,000–10,000,000+ (128K–10M+，Scout实验达10M)	开源、本地部署、自定义强；部分变体超长	免费 (开源)；API收费低
Baidu ERNIE 4.5 / Wenxin Yiyan	128,000 (128K)	中文强、多模态、推理好	免费基础；收费 (输入 $0.55/M, 输出 $2.2/M)
Alibaba Tongyi Qianwen (Qwen3-Max / Qwen3系列)	256,000–1,000,000+ (256K–1M+)	多语言、编程数学顶尖；Qwen3 系列长上下文优秀	免费 (开源)；收费 (输入 $1.6/M, 输出 $6.4/M)
ByteDance Doubao 1.5 Pro	256,000 (256K)	高效MoE、低成本、长文档/代码代理	收费 (输入 $0.11/M, 输出 $0.275/M；促销更低)
Tencent Hunyuan (HY 2.0)	256,000 (256K)	MoE、推理/代码强、边缘部署	免费小模型；收费企业约 $0.4-1.2/M
Huawei Pangu 5.5	128,000 (128K)	企业级、多模态、金融/工业强	收费 (Huawei Cloud自定义报价)
DeepSeek-V3 / V3.2 / R1系列	128,000 (128K，官方主流；API有时限64K，部分平台显示163K但实际可靠128K)	开源MoE王者、代码/数学/推理SOTA；长上下文针测试优秀，但>20-64K召回衰减明显	免费 (开源本地0成本)；API极低 (输入 $0.07-0.55/M, 输出 $0.42-2.19/M；缓存省90%)

关键说明

缩写解释：128K = 128,000 tokens（约10万字英文或更多中文）；1M = 1,000,000 tokens（约75万字）；2M = 2,000,000 tokens。
有效性 vs 标称：许多模型标称1M+，但实际长上下文召回率（needle-in-haystack测试）因模型而异。Gemini和Grok在超长上下文更稳定，DeepSeek在中等长度（<64K）表现极稳。
写代码推荐：预算/中文/开源 → DeepSeek-V3 (128K)；超大代码库/agent → Grok 4 Fast (2M) 或 Gemini 2.5 Pro (1M–2M)。

posted @ 2026-01-15 13:45 秋夜雨巷阅读(1) 评论(0) 收藏举报

秋夜雨巷

GitHub地址: https://autkevin.github.io/
本博客是为了记录工作和学习中的总结，可以交流学习，请勿在不理解的情况下直接复制粘贴

AI上下文tokens对比

AI模型对比

关键说明

公告

秋夜雨巷

GitHub地址: https://autkevin.github.io/ 本博客是为了记录工作和学习中的总结，可以交流学习，请勿在不理解的情况下直接复制粘贴

AI上下文tokens对比

AI模型对比

关键说明

公告

GitHub地址: https://autkevin.github.io/
本博客是为了记录工作和学习中的总结，可以交流学习，请勿在不理解的情况下直接复制粘贴