Gemini 2.5 Flash-Lite 稳定版(GA)发布
谷歌宣布其速度最快、成本最低的 Gemini 2.5 Flash-Lite 模型已正式进入稳定状态(GA)。
Gemini 2.5 Flash-Lite 在性能和成本之间取得了平衡,原生支持 100 万 token 上下文等高级功能。该模型定价为每百万输入 token 0.10 美元,每百万输出 token 0.40 美元,与 GPT-4.1 Nano 的价格相当。与预览版相比,其音频输入定价降低了 40%。
Gemini 2.5 Flash-Lite 在编码、数学、推理和多模态理解等多个基准上表现优于 2.0 Flash-Lite,支持 100 万 token 的上下文窗口、可控的思考预算(thinking budgets),以及 Grounding with Google Search、代码执行和 URL 上下文等原生工具。
开发者现在可以通过在代码中指定 gemini-2.5-flash-lite 来使用该稳定版模型。原有的预览版别名计划于 8 月 25 日移除。
同类文章推荐: