谷歌今年早些时候推出了 Gemini 2.5,其中首款机型是 Pro(实验版)。几个月后,谷歌又在早期访问中推出了一款速度更快的模型,名为 Gemini 2.5 Flash。现在,该公司对这两款模型发布了最新进展,并预览推出了一款速度更快的新模型。

目前要搞清楚所有不同的 Gemini 模型可能有点困难,但谷歌在 2.5 系列中推出了第三款模型。这款新模型名为 Gemini 2.5 Flash-Lite,据称是该系列中延迟最低、成本最低的版本。根据谷歌的说法,该模型最适用于“高吞吐量任务,例如大规模分类或摘要”。
和 Gemini 2.5 Pro 与 Flash 一样,Flash-Lite 也被描述为推理模型。这意味着它在回应之前可以进行推理,以提高准确性。但与前两款不同,谷歌表示 Flash-Lite 默认关闭了“思考”功能,因为该模型重点是成本和速度。不过,该模型“允许通过 API 参数动态控制思考预算”。
与此同时,这家总部位于山景城的公司宣布 Gemini 2.5 Pro 和 Flash 现在已进入稳定阶段并正式开放使用。随着稳定版本的发布,谷歌还更新了 Flash 的定价:输入成本上调了 0.15 美元,而输出成本则从 3.50 美元 降至 2.50 美元。

您可以继续按照现有的定价方案使用 2.5 Flash 预览版 或 2.5 Pro 预览版,直到它们的弃用日期。对于 2.5 Pro 预览版,弃用日期将是 2025 年 6 月 19 日。在 谷歌关闭 2.5 Flash 预览版 之前,您可以使用到 2025 年 7 月 15 日。