Coding Agents 软件分析

这次作业我选择分析开源的 Coding Agents 软件,研究对象是 openai/codex,竞品则选了 badlogic/pi-mono。从编译优化开始接触 Codex,到现在使用 Pi,我接触这类软件已经有三个多月了。所以借着作业这个机会,把我之前比较零散的使用感受,再加上这次专门查的文档、源码和几篇博文,重新整理一次。

“这类”软件到目前为止也还没有一个明确的术语定义,大多总是以 Agent、Harness、Engieering、Coding、CLI 等及其派生词汇为排列组合的结果,或者以 Claude Code 为代表而称之。Simon Willison 在 What is agentic engineering? 里“使用 Agentic Engineering 一词来描述借助 Coding Agents 来开发软件的实践”,他认为 Coding Agents 是“既能编写代码又能执行代码的代理”。所以我就借用他的定义,将“这类”软件在本文称作 Coding Agents 软件。我想现在大部分人还没有搞清楚 LLM、Coding Agents、Agentic Engineering 这些词汇的区别,如果有人专门写一篇文章来讲清楚这些定义,那一定很有意义。

Codex 是 OpenAI 推出的 Coding Agents 软件。Pi 则是当前爆火的 OpenClaw(小龙虾)背后运行的 Coding Agents 软件(其实该怎么去定义 OpenClaw,我也觉得模棱两可)。人们在使用这些软件的时候,或是根本不关注背后的一切逻辑(就像 OpenClaw 那样),或是只看其使用的模型效果如何,然而 OpenAI 自己在写 Codex 的几篇文章时,也一直在强调一点:真正决定产品体验的,往往不只是模型本身,而是外面那层系统怎么设计。工具怎么给,权限怎么管,输出怎么展示,失败之后怎么恢复,长对话怎么压缩,这些都会影响最后的感觉。换句话说,Coding Agents 之间的差别,不只是模型的差别,也是整个实现方式的差别。

这次作业里我还是以 Codex 作为主要分析对象,Pi 作为竞品来进行对比。Codex 算是我接触的第一个 Coding Agents 的 CLI 软件。在此之前我还安装过 Claude Code、Gemini CLI 等,但都没有真正使用过。上个月我了解并使用了 Pi 开始进行一些开发。相比于 Codex,我更喜欢 Pi“做减法”的设计,但是它的名字实在是太过普通了,以至于我在互联网上很难去搜有关它的资料。

【TODO】

posted on 2026-03-18 22:39  tsxb  阅读(0)  评论(0)    收藏  举报