主流大模型上下文限制与比较

一、简介

　　简单了解下主流大模型的最大上下文长度和输出长度，下面单位都是token

公司	模型	最大上下文长度	最大输出	训练数据截止
DeepSeek	DeepSeek-R1-0528	64k	64k	2024年7月
DeepSeek	DeepSeek-V3-0324	64k	8k	2024年7月
OpenAI	ChatGPT 5	400k	128k	2024年10月1日
Anthropic	Claude Sonnet 4	200k	64k	2025年3月
Anthropic	Claude Opus 4.1	200k	32k	2025年3月
Google	Gemini 2.5 Pro	1M	64k	2025年1月
Google	Gemini 2.5 Flash	1M	64k	2025年1月
xAI	Grok4	256k
阿里	Qwen3	128K
阿里	Qwen3 Coder	1M

二、AI 排名相关网站

1、AI模型排名，点击 Leaderboard(推荐)

https://lmarena.ai/leaderboard

2、LiveBench 是一个用于评估和基准测试大语言模型开发平台，也很有参考意义

https://livebench.ai/

想要知道最新AI大模型，最快消息来源之一就是看 transformers releases

https://github.com/huggingface/transformers/releases

posted @ 2025-03-05 14:59 龙虚度阅读(5479) 评论(0) 收藏举报

刷新页面返回顶部