Gemini 2.5 Flash-Lite 稳定版（GA）发布

谷歌宣布其速度最快、成本最低的 Gemini 2.5 Flash-Lite 模型已正式进入稳定状态（GA）。

Gemini 2.5 Flash-Lite 在性能和成本之间取得了平衡，原生支持 100 万 token 上下文等高级功能。该模型定价为每百万输入 token 0.10 美元，每百万输出 token 0.40 美元，与 GPT-4.1 Nano 的价格相当。与预览版相比，其音频输入定价降低了 40%。

Gemini 2.5 Flash-Lite 在编码、数学、推理和多模态理解等多个基准上表现优于 2.0 Flash-Lite，支持 100 万 token 的上下文窗口、可控的思考预算（thinking budgets），以及 Grounding with Google Search、代码执行和 URL 上下文等原生工具。

开发者现在可以通过在代码中指定 gemini-2.5-flash-lite 来使用该稳定版模型。原有的预览版别名计划于 8 月 25 日移除。

posted @ 2025-07-23 15:09 开源资讯说阅读(202) 评论(0) 收藏举报

刷新页面返回顶部

Gemini 2.5 Flash-Lite 稳定版（GA）发布

公告