长上下文+编程：Gemini 2.5 Pro 以力破局之道？

LLM · 2025-04-14

一经发布，就口碑炸裂的 Gemini 2.5 Pro，日前公布了定价。

有几个亮点值得关注：

价格向 OpenAI 和Cluade 看齐。一年之前，Gemini Pro是一个追赶模型，1.5 版的定价是百万 token 输出 5 美元。这个价格低于 GPT-4o 的 10 美元和 Claude 3.5 Sonnet的 15 美元。但伴随不断上升的口碑，Gemini 2.5 Pro 如今来到了 10-15 美元的区间。
分档定价。Gemini一向以 1M 超长上下文为特色，是 Claude 3.7 Sonnet 的五倍。从定价也可以看到，在 200K(Cluade 的好球区)之下，输出价格和 GPT-4o 看齐，仅为 10 美元；只有在 Cluade 无法企及的 200K 以上上下文，才收取 15 美元的输出费用。
更便宜的输入价格。以入门档位，Gemini 2.5 Pro输入价格是输出价格的 1/8，相比之下 GPT-4o是 1/4，Cluade 是 1/5。显然 Gemini 是最鼓励长上下文输入的。

模型	上下文	输出	输入价格	输出价格
GPT-4o	128K	16K	2.5	10
Claude 3.7 Sonnet	200K	64K	3	15
Gemini 2.5 Pro Preview <=200K token >200K token	1M	66K	1.25 2.5	10 15

价格均为百万 token 的美元报价，来源 Openrouter

当然，在定价之余，Gemini 2.5 Pro 另一个不容忽视的特性就是强大的编程能力，在许多用户看来已经不亚于 Claude 3.7 Sonnet 了。

最近听Dwarkesh Patel的播客《2027 Intelligence Explosion: Month-by-Month Model — Scott Alexander & Daniel Kokotajlo》，两位受访者对于 AI 2027 路径的一大预测就是：

2025 年，我们预期会看到稍好的编程能力。2026 年，则是稍好的智能体和进一步提升的编程能力。我们之所以将场景命名为“2027”，是因为我们认为那一年这些积累将开始显现成果。智能爆炸将全面展开；AI 智能体将变得足够好，开始能够协助（初期可能还不能完全主导）AI 研究。

我们引入了一个概念叫“研发进展乘数 (R&D progress multiplier)”，它衡量的是：在 AI 协助下，一个月内能取得相当于没有 AI 协助多少个月的进展。比如到 2027 年某个时候（可能是3月份），我们预测算法进展的乘数将达到 5 倍。

AI 的编程能力如何？

伴随 Cursor、Windsurf 等的走红，吐槽声也越来越多，主要集中在：伴随项目的变大，AI 往往在修改中顾此失彼，修一个 bug，引发更多 bug。

但在这个问题上，我们有必要区分：AI 的能力问题和 Cursor 等 AI IDE 的局限性。

为什么 AI 编程往往顾此失彼，很大程度上是“省流”闹的。

因为 Cursor 和 Windsurf 等都是月费制，为了避免对 Claude 3.7 Sonnet 等昂贵模型的肆意消耗，不仅月费规定了对话次数，而且每次对话都竭尽所能节省 token 开销。

最著名的“抠门”，莫过于那个 600 行规定：

每次查看源代码，先看 200行，找不到再看 200行，最多只看到 600行。

无法掌握代码的全局，其实是许多 AI IDE“顾此失彼”的根源。

但伴随 Gemini 2.5 Pro 的代码能力上升，伴随更便宜的输入价格，会否推动更多的 AI IDE 去查看更多的源码来做修改？

别忘了，在 Gemini 1.5 Flash 时代，Gemini 是支持缓存的，对于重复调用的内容(尤其适合大量源代码)，是可以以 1/4 的价格计算输入 token，这就更适合 AI 编程了。虽然 Gemini 2.5 Pro 目前还没支持缓存，但未来未尝不可能提供。

更何况，10 美元的月费，对于一款真正的编程生产力工具，从替代初级程序员角度，其实便宜的离谱了——离谱到限制了 AI IDE 的发挥。

对于那些愿意按 token 消耗计费的中阶用户，如果愿意接受 50 美元甚至 100 美元的月开支，那么或许 AI 编程的实际效果会有大幅提升的可能。

从 AI 编程大幅推动整个 AI 发展的角度，我对 2025 年 Gemini 2.5 Pro 的表现，充满期待。

#Gemini