Gemini 2.5 Flash-Lite 稳定版(GA)发布

谷歌宣布其速度最快、成本最低的 Gemini 2.5 Flash-Lite 模型已正式进入稳定状态(GA)。

Gemini 2.5 Flash-Lite 在性能和成本之间取得了平衡,原生支持 100 万 token 上下文等高级功能。该模型定价为每百万输入 token 0.10 美元,每百万输出 token 0.40 美元,与 GPT-4.1 Nano 的价格相当。与预览版相比,其音频输入定价降低了 40%。

1

Gemini 2.5 Flash-Lite 在编码、数学、推理和多模态理解等多个基准上表现优于 2.0 Flash-Lite,支持 100 万 token 的上下文窗口、可控的思考预算(thinking budgets),以及 Grounding with Google Search、代码执行和 URL 上下文等原生工具。

开发者现在可以通过在代码中指定 gemini-2.5-flash-lite 来使用该稳定版模型。原有的预览版别名计划于 8 月 25 日移除。

posted @ 2025-07-23 15:09  开源资讯说  阅读(140)  评论(0)    收藏  举报