主流大模型上下文限制与比较
一、简介
简单了解下主流大模型的最大上下文长度和输出长度,下面单位都是token
| 公司 | 模型 | 最大上下文长度 | 最大输出 | 训练数据截止 |
| DeepSeek | DeepSeek-R1-0528 | 64k | 64k | 2024年7月 |
| DeepSeek-V3-0324 | 64k | 8k | 2024年7月 | |
| OpenAI | ChatGPT 5 | 400k | 128k | 2024年10月1日 |
| Anthropic | Claude Sonnet 4 | 200k | 64k | 2025年3月 |
| Claude Opus 4.1 | 200k | 32k | 2025年3月 | |
| Gemini 2.5 Pro | 1M | 64k | 2025年1月 | |
| Gemini 2.5 Flash | 1M | 64k | 2025年1月 | |
| xAI | Grok4 | 256k | ||
| 阿里 | Qwen3 | 128K | ||
| Qwen3 Coder | 1M |
二、AI 排名相关网站
1、AI模型排名,点击 Leaderboard(推荐)
https://lmarena.ai/leaderboard
2、LiveBench 是一个用于评估和基准测试大语言模型开发平台,也很有参考意义
想要知道最新AI大模型,最快消息来源之一就是看 transformers releases
https://github.com/huggingface/transformers/releases

浙公网安备 33010602011771号