摘要:
Loop Engineering — 从"写 prompt"到"设计循环",AI Agent 的下一次进化 "I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to 阅读全文
摘要:
Agent Eval 最佳实践:从 Benchmark 到生产监控的完整落地指南 Anthropic 工程团队在 2026 年 1 月发了一篇博客《Demystifying evals for AI agents》,里面有一句话很直接:"We've seen teams with 90% bench 阅读全文
摘要:
如何打造一支 AI 原生团队:5-7 人小团队的四步搭建指南 最近三个月,被不同的人问了同一组问题,频率高到让我决定写这篇: "你们说的 AI 原生,到底是个啥?是不是给大家配个 Cursor 就算了?" "你认为真正的 AI 原生团队长什么样子?" "我们也想搞一个 AI 原生团队,怎么搭?要招些 阅读全文