这两天开发者社区最炸的消息:GitHub Copilot 不再按月定额收费,改按 token 计费了。

"GitHub 不装了,用户炸锅了"——这是 V2EX 上的原话。从 $10/月无限用,到每一行补全、每一次对话都精确计费,这不是涨价,是计费模型的彻底翻篇。而且不只是 Copilot:Cursor、Windsurf、Codex 等主流 AI 编程工具都在往同一个方向走。

"AI 编程的低价时代结束"不是夸张,是正在发生的事实。

从订阅到计量:发生了什么

过去两年,AI 编程工具的定价逻辑很简单:按月付费,随便用。 GitHub Copilot $10/月,Cursor Pro $20/月——你付一笔固定的钱,然后想怎么调就怎么调、想补全多少行就补全多少行。

这种模式对开发者极度友好,但对平台来说是个财务黑洞。每个用户的 token 消耗差异巨大:有人一天只补全几十行,有人用 Agent 模式一个任务循环吃掉几百万 token。固定价格下,重度用户是"被补贴"的,平台扛着亏损换市场占有率。

现在市场占有率够了,账该算了。

按 token 计费意味着:你调用的模型越强(Claude Opus vs GPT-4o-mini)、上下文越长(整个代码库 vs 当前文件)、循环轮次越多(Agent 模式 vs 单次补全),费用就越高。以后写代码不光要关心时间复杂度,还要关心 token 复杂度。

这不是孤例:整个行业在转向

看一组时间线:

  • GitHub Copilot:从 $10/月 定额 → token 计费
  • Cursor:去年就开始推 usage-based pricing,Pro 用户有月度 token 配额
  • Windsurf:一直是按 "flow actions" 计费,本质也是用量付费
  • Codex (OpenAI):天然就是 API token 计费
  • Claude Code:走 Anthropic API,按 token 收费

唯一的例外是那些跑本地模型的工具(如 Continue + Ollama),但它们的体验和云端模型差距明显。

趋势很清楚了:AI 编程工具正在从"软件产品"变成"基础设施"。 就像没人会给 AWS EC2 定一个"随便用"的月费——算力就是钱。现在 AI 推理也是。

开发者的新账本

按 token 计费之后,一个开发者一个月要花多少钱?我们来算一笔粗账:

假设你每天用 Copilot 写 4 小时代码:

  • 代码补全:每小时约 200 次补全,每次平均 50 token → 4 × 200 × 50 = 40,000 token
  • Chat 对话:每天 10 轮对话,每轮 2000 token 输入 + 500 token 输出 → 25,000 token
  • 如果用了 Agent 模式(自动改文件、跑测试),一天轻松加 100,000 token

一天合计约 165,000 token。一个月 20 个工作日 → 330 万 token/月

以 Claude 3.5 Sonnet API 价格约 $3/百万输入 token、$15/百万输出 token 来算(混合约 $5-8/百万 token),一个月大约 $16 - $26。比原来的 $10/月翻倍以上,而且这只是中等使用强度。

重度 Agent 用户(比如上个月烧掉 5 亿美元的那家公司的开发者们),token 消耗轻松翻 10 倍,一个月的账单可能奔着 $200+ 去。

这还不是最坏的。最坏的是:你不知道会花多少。 一个失控的 Agent 循环、一个超大的代码库索引、一次"帮我重构整个项目"的对话——你的账单可能瞬间爆掉。

开发者的应对策略

面对这个新现实,有几件事可以做:

1. 给 AI 加预算护栏

不管工具本身有没有限额功能,你自己心里要有个数。做法:

  • 设定每日/每月 token 预算上限(工具支持的话)
  • 给 Agent 任务加轮次限制:"重构这个文件,最多 5 轮"
  • 大任务拆小:一次性"重构整个项目"改成逐个文件处理

2. 学会"不用 AI 的时候"

以前 $10/月无限用,补全一个 console.log() 也用 AI 无所谓。现在每一行补全都算钱,你需要恢复判断力:

  • 简单、重复、模板化的代码 → 用 AI
  • 核心逻辑、架构设计、需要深度理解的代码 → 自己写
  • 写完的代码 → 自己 review,别让 AI review AI 写的代码(二次收费 + 质量不可控)

3. 混合策略:本地模型 + 云端模型

高频低难度的补全可以用本地小模型(如 Codestral + Ollama),复杂任务才调云端大模型。这样日常补全基本不花钱,只在需要"深度思考"时付费。

4. 关注工具的分层策略

按 token 计费后,工具方大概率会推分层:

  • 补全用便宜模型(GPT-4o-mini、Claude Haiku)
  • Chat 用中等模型(Sonnet、GPT-4o)
  • Agent / 重构用顶级模型(Opus)

你的任务是搞清楚什么时候该升档、什么时候该降档。 就像你不会用 Ferrari 去超市买菜一样,别用 Opus 去补全 fmt.Println

更深一层:这意味着什么

GitHub 敢撕掉平价面具,说明一件事:AI 编程已经不是"增值功能",而是"刚需基础设施"。

当你把一个功能从附加服务变成独立计费单元,说明你相信用户离不开它。GitHub 的判断是对的——2026 年的开发者,不用 AI 辅助编程的已经是少数派。

但这也意味着行业进入了一个新阶段:

  1. AI 编程的成本意识将成为基本素养。 就像云服务时代开发者要关注 EC2 账单一样,"这个任务值不值得调 AI"会变成日常判断。

  2. 工具会分化为"重型"和"轻型"。 按 token 计费后,会出现一批主打"省 token"的工具(优化 prompt、压缩上下文、缓存复用),和一批主打"效果极致"的工具(不管成本,只管结果)。开发者的选择不是"用不用 AI",而是"在哪个场景用哪种 AI"。

  3. "AI 编程生产力"的定义会变。 以前衡量标准是"写了多少行代码",以后是"每花一美元 token 产出了多少有效代码"。效率 = 有效输出 / token 成本。

  4. 个人 AI 编程预算会变成和咖啡预算一样的日常开销。 一个月 $20-50 的 AI 编程费用,对大部分职业开发者来说是好投资——前提是花在刀刃上。

我的看法

说句实话:按 token 计费是这个行业必然的终点。

免费 / 低价是获客手段,不是商业模式。AI 推理的成本是实打实的 GPU 算力,电费和硬件折旧不会因为你的订阅费是 $10 还是 $100 而改变。这一天迟早会来,只是 GitHub 先捅破了窗户纸。

但我不觉得这是坏事。免费和低价会催生滥用。 当你对 AI 的每次调用都付出代价时,你会更认真地想"这个补全真的需要吗?"——这种克制对代码质量是好事。我见过太多开发者让 Copilot 把整个函数写出来然后删掉 80%——如果这 80% 全是花的自己的钱,他会先在脑子里想清楚再让 AI 动手。

对普通开发者来说,一个月 $20-30 的 AI 编程支出是可以接受的——前提是你把它当成生产力投资而不是理所当然的基础设施。就像你不会抱怨 IDE 要花钱买 License 一样(JetBrains 一年 $200+),好的工具值得付费。

真正需要担心的是:计费的透明度。 如果 GitHub 不能给你一个清晰的实时 token 消耗面板——让你随时知道自己花了多少钱、花在哪了——那用户的愤怒是正当的。没有计费透明的 usage-based pricing 就是暗箱操作。


$10 无限畅饮的时代结束了。下一个时代的关键词是:预算、分层、判断力。而这些恰好也是好工程师本来就应该具备的东西。