EarlMind

长上下文+编程:Gemini 2.5 Pro 以力破局之道?

LLM  ·  

一经发布,就口碑炸裂的 Gemini 2.5 Pro,日前公布了定价。

有几个亮点值得关注:

模型 上下文 输出 输入价格 输出价格
GPT-4o 128K 16K 2.5 10
Claude 3.7 Sonnet 200K 64K 3 15
Gemini 2.5 Pro Preview
<=200K token
>200K token
1M 66K 1.25
2.5
10
15

价格均为百万 token 的美元报价,来源 Openrouter

当然,在定价之余,Gemini 2.5 Pro 另一个不容忽视的特性就是强大的编程能力,在许多用户看来已经不亚于 Claude 3.7 Sonnet 了。

最近听Dwarkesh Patel的播客《2027 Intelligence Explosion: Month-by-Month Model — Scott Alexander & Daniel Kokotajlo》,两位受访者对于 AI 2027 路径的一大预测就是:

2025 年,我们预期会看到稍好的编程能力。2026 年,则是稍好的智能体和进一步提升的编程能力。我们之所以将场景命名为“2027”,是因为我们认为那一年这些积累将开始显现成果。智能爆炸将全面展开;AI 智能体将变得足够好,开始能够协助(初期可能还不能完全主导)AI 研究。

我们引入了一个概念叫“研发进展乘数 (R&D progress multiplier)”,它衡量的是:在 AI 协助下,一个月内能取得相当于没有 AI 协助多少个月的进展。比如到 2027 年某个时候(可能是3月份),我们预测算法进展的乘数将达到 5 倍。

AI 的编程能力如何?

伴随 Cursor、Windsurf 等的走红,吐槽声也越来越多,主要集中在:伴随项目的变大,AI 往往在修改中顾此失彼,修一个 bug,引发更多 bug

但在这个问题上,我们有必要区分:AI 的能力问题Cursor 等 AI IDE 的局限性

为什么 AI 编程往往顾此失彼,很大程度上是“省流”闹的。

因为 Cursor 和 Windsurf 等都是月费制,为了避免对 Claude 3.7 Sonnet 等昂贵模型的肆意消耗,不仅月费规定了对话次数,而且每次对话都竭尽所能节省 token 开销。

最著名的“抠门”,莫过于那个 600 行规定:

每次查看源代码,先看 200行,找不到再看 200行,最多只看到 600行

无法掌握代码的全局,其实是许多 AI IDE“顾此失彼”的根源。

但伴随 Gemini 2.5 Pro 的代码能力上升,伴随更便宜的输入价格,会否推动更多的 AI IDE 去查看更多的源码来做修改?

别忘了,在 Gemini 1.5 Flash 时代,Gemini 是支持缓存的,对于重复调用的内容(尤其适合大量源代码),是可以以 1/4 的价格计算输入 token,这就更适合 AI 编程了。虽然 Gemini 2.5 Pro 目前还没支持缓存,但未来未尝不可能提供。

更何况,10 美元的月费,对于一款真正的编程生产力工具,从替代初级程序员角度,其实便宜的离谱了——离谱到限制了 AI IDE 的发挥。

对于那些愿意按 token 消耗计费的中阶用户,如果愿意接受 50 美元甚至 100 美元的月开支,那么或许 AI 编程的实际效果会有大幅提升的可能。

从 AI 编程大幅推动整个 AI 发展的角度,我对 2025 年 Gemini 2.5 Pro 的表现,充满期待。

#

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注