把 Agent 当程序员管,别当许愿池——AI 开发模式的实战沉淀
从"忘掉代码"到"管住代码"
Karpathy 那句 "forget that the code even exists" 出来时,大家都觉得浪漫——自然语言进,能跑的程序出,程序员终于不用管花括号了。但真 vibe coding 了几个月、几个项目下来,翻车姿势其实高度雷同:
- 改到第 3 轮,AI 把之前写对的逻辑给你删了("改出 regression" 是 agent 模式最高频的痛)
- 没给全局架构约束,AI 默认选最俗的方案,几次迭代后变成意大利面
- Prompt 太模糊,"做个好看的页面"= 开盲盒,出来像 2015 年的 Bootstrap demo
- 上下文拖太长,同一个会话里 AI 开始"健忘 + 乱猜"
- 能跑 ≠ 对,能跑但藏着 SQL 注入 / 弱哈希 / 边界 case 崩,是最危险的那种 bug
YC 2025 冬季批次里 25% 的初创 codebase 95% 是 AI 生成的——这说明"能产出了",但也说明"没纪律管着,AI 代码会反过来吃掉你"。
所以这大半年行业里真正在沉淀的,不是"哪个 prompt 更好用",而是工作模式本身从"探索态"进化到"交付态" :从靠模糊意图+即时反馈的 vibe,过渡到靠规格文档+工程约束的 Spec-Driven。下面这 6 条是我觉得最值得固化的。
1. 项目共识文档先落地,再写第一行代码
CLAUDE.md / AGENTS.md / cursor rules,不管叫什么,本质是给 AI 做"入职培训"——项目背景、技术栈、代码规范、禁止事项、目录约定,一次性写清楚。
没这个文件时,AI 每次对话都像新来的实习生,第 8 轮开始自由发挥。有了之后,同一份 prompt 出来的代码质量差一档。
💡 进阶一步:把 PRD 也先让 AI 帮你磨出来——用户流程、UI 规格、技术指标、成功度量,存成 README.md 当 north star,再动手。
2. Spec 先行,哪怕只是"迷你 Spec"
5 行也说清:背景 / 输入输出 / 边界条件 / 验收标准。比直接说"帮我做个登录"强十倍。
再进一步就是 Spec-Driven Development:spec 作为 single source of truth,AI 按 spec 生成,review 对的是 spec 不是凭感觉。Y Combinator 那批 95% AI 生成代码的团队,基本都走到这一步了。
3. 小步闭环:生成 → 验证 → 提交 → 下一步
这是 vibe coding 最容易违背的一条。别一次性让 AI 生成全量代码,别一次性让 AI "把整个项目重构一下"。正确节奏:
- 按分层/模块拆成独立子任务
- 每完成一个可验证的小改动立刻跑(单元测试 / lint / 手动点一遍)
- 过了就
git commit,不过就回退 - 再进下一环
腾讯云那篇一人团队的 70/20/10 法则也呼应这个——70% 时间和 AI 聊需求和设计,20% AI 执行,10% 人工 review,"看不懂的代码不提交"。
4. 把 Agent 当程序员管,不当许愿池
这句话是 Reddit/V2EX 那波实战帖里最被认同的一句。落到动作上:
- 一次只做一件事("先实现登录,完了我再告诉你下一步",而不是"帮我做登录+注册+个人中心")
- 每个文件不超过 200 行,按职责拆,禁止单体巨文件
- 上下文拖长了就用
/clear或/compact开新会话,关键状态写入 memory-bank/ - 调试时给 AI 喂:预期行为 + 实际行为 + 报错 + 相关代码 + 已尝试过什么
5. 建自己的 Skill / Prompt 库,别每次从零描
"每个 Skill = 目标 + 上下文 + 约束 + 步骤 + 输出模板 + 验收标准"——比如:
- 需求分析类:用户故事拆解、验收标准生成
- 后端类:OpenAPI 草案、Prisma 模型、异常中间件
- 前端类:组件拆分、表单校验、a11y 检查
- 质量类:code review prompt、安全扫描、性能 diff
项目做完,让 AI 自己把部署步骤、环境配置、常见坑输出一份归档。下次新项目直接复用,这才是"经验沉淀"的实体形态。
6. AI 生成代码 = 初级同事提交,门禁同等待遇
这条是底线:
- 逻辑错误要靠你自己或测试抓——AI 特别擅长"看起来对但边界崩"
- 安全敏感段(auth、加密、支付)必须人 review,AI 不知道最新 CVE
- 核心业务建议人复核,infra/脚手架类可放宽
- 测试让 AI 先写,但你得告诉它"帮我想想哪些 edge case 会炸"
竞争力迁去哪了
Vibe Coding 不是对编程的背叛,是把人从 80% 机械劳动里捞出来——但前提是你有纪律地用它。不然爽三个月,后面全是还 tech debt。
以后最值钱的能力不是"会写代码",是"知道该做什么 + 能判断 AI 做得对不对"。
代码不稀缺了,稀缺的是架构判断、需求拆解、对 AI 输出的甄别力,以及——把这一套 workflow 固化下来的工程纪律。

浙公网安备 33010602011771号