一经发布,就口碑炸裂的 Gemini 2.5 Pro,日前公布了定价。
有几个亮点值得关注:
- 价格向 OpenAI 和Cluade 看齐。 一年之前,Gemini Pro是一个追赶模型,1.5 版的定价是百万 token 输出 5 美元。 这个价格低于 GPT-4o 的 10 美元和 Claude 3.5 Sonnet的 15 美元。但伴随不断上升的口碑,Gemini 2.5 Pro 如今来到了 10-15 美元的区间。
- 分档定价。Gemini一向以 1M 超长上下文为特色,是 Claude 3.7 Sonnet 的五倍。从定价也可以看到,在 200K(Cluade 的好球区)之下,输出价格和 GPT-4o 看齐,仅为 10 美元;只有在 Cluade 无法企及的 200K 以上上下文,才收取 15 美元的输出费用。
- 更便宜的输入价格。以入门档位,Gemini 2.5 Pro输入价格是输出价格的 1/8,相比之下 GPT-4o是 1/4,Cluade 是 1/5。显然 Gemini 是最鼓励长上下文输入的。
模型 | 上下文 | 输出 | 输入价格 | 输出价格 |
---|---|---|---|---|
GPT-4o | 128K | 16K | 2.5 | 10 |
Claude 3.7 Sonnet | 200K | 64K | 3 | 15 |
Gemini 2.5 Pro Preview <=200K token >200K token |
1M | 66K | 1.25 2.5 |
10 15 |
价格均为百万 token 的美元报价,来源 Openrouter
当然,在定价之余,Gemini 2.5 Pro 另一个不容忽视的特性就是强大的编程能力,在许多用户看来已经不亚于 Claude 3.7 Sonnet 了。
最近听Dwarkesh Patel的播客《2027 Intelligence Explosion: Month-by-Month Model — Scott Alexander & Daniel Kokotajlo》,两位受访者对于 AI 2027 路径的一大预测就是:
2025 年,我们预期会看到稍好的编程能力。2026 年,则是稍好的智能体和进一步提升的编程能力。我们之所以将场景命名为“2027”,是因为我们认为那一年这些积累将开始显现成果。智能爆炸将全面展开;AI 智能体将变得足够好,开始能够协助(初期可能还不能完全主导)AI 研究。
我们引入了一个概念叫“研发进展乘数 (R&D progress multiplier)”,它衡量的是:在 AI 协助下,一个月内能取得相当于没有 AI 协助多少个月的进展。比如到 2027 年某个时候(可能是3月份),我们预测算法进展的乘数将达到 5 倍。
AI 的编程能力如何?
伴随 Cursor、Windsurf 等的走红,吐槽声也越来越多,主要集中在:伴随项目的变大,AI 往往在修改中顾此失彼,修一个 bug,引发更多 bug。
但在这个问题上,我们有必要区分:AI 的能力问题和 Cursor 等 AI IDE 的局限性。
为什么 AI 编程往往顾此失彼,很大程度上是“省流”闹的。
因为 Cursor 和 Windsurf 等都是月费制,为了避免对 Claude 3.7 Sonnet 等昂贵模型的肆意消耗,不仅月费规定了对话次数,而且每次对话都竭尽所能节省 token 开销。
最著名的“抠门”,莫过于那个 600 行规定:
每次查看源代码,先看 200行,找不到再看 200行,最多只看到 600行。
无法掌握代码的全局,其实是许多 AI IDE“顾此失彼”的根源。
但伴随 Gemini 2.5 Pro 的代码能力上升,伴随更便宜的输入价格,会否推动更多的 AI IDE 去查看更多的源码来做修改?
别忘了,在 Gemini 1.5 Flash 时代,Gemini 是支持缓存的,对于重复调用的内容(尤其适合大量源代码),是可以以 1/4 的价格计算输入 token,这就更适合 AI 编程了。虽然 Gemini 2.5 Pro 目前还没支持缓存,但未来未尝不可能提供。
更何况,10 美元的月费,对于一款真正的编程生产力工具,从替代初级程序员角度,其实便宜的离谱了——离谱到限制了 AI IDE 的发挥。
对于那些愿意按 token 消耗计费的中阶用户,如果愿意接受 50 美元甚至 100 美元的月开支,那么或许 AI 编程的实际效果会有大幅提升的可能。
从 AI 编程大幅推动整个 AI 发展的角度,我对 2025 年 Gemini 2.5 Pro 的表现,充满期待。
发表回复