主流大模型上下文限制与比较

 

一、简介

  简单了解下主流大模型的最大上下文长度和输出长度,下面单位都是token 

 

公司 模型 最大上下文长度 最大输出 训练数据截止
DeepSeek DeepSeek-R1-0528 64k 64k 2024年7月
DeepSeek-V3-0324 64k 8k 2024年7月
OpenAI ChatGPT 5 400k 128k 2024年10月1日
Anthropic Claude Sonnet 4 200k 64k 2025年3月
Claude Opus 4.1 200k 32k 2025年3月
Google Gemini 2.5 Pro 1M 64k 2025年1月
Gemini 2.5 Flash 1M 64k 2025年1月
xAI Grok4 256k    
阿里 Qwen3 128K    
Qwen3 Coder 1M    

 

 

二、AI 排名相关网站

1、AI模型排名,点击 Leaderboard(推荐)

https://lmarena.ai/leaderboard

 

2、LiveBench 是一个用于评估和基准测试大语言模型开发平台,也很有参考意义

https://livebench.ai/

 

想要知道最新AI大模型,最快消息来源之一就是看 transformers releases

https://github.com/huggingface/transformers/releases

 

posted @ 2025-03-05 14:59  龙虚度  阅读(3169)  评论(0)    收藏  举报