作为一个项目程序开发人员,如何高效使用 Codex?

桌面端、CLI、Skills、AGENTS.md、Record & Replay——从日常高频技巧到进阶配置,让你的 Codex 从"能用"进化到"懂你"。

目录

一、开篇:桌面端才是大多数人的主战场

OpenAI Codex 目前有三个形态:桌面 App(macOS + Windows)、CLI(终端命令行)、IDE 扩展(VS Code 等)。2026 年 2 月桌面端正式发布,3 月登陆 Windows——自此,图形化的桌面 App 就成了绝大多数开发者的主力入口。

本文以桌面端为默认视角来组织内容,同时为 CLI 用户单列一章。无论你用哪种形态,核心能力(Skills、AGENTS.md、MCP、Automations)是打通的。

当前最新模型:GPT-5.5(2026 年 4 月 23 日发布),桌面端和 CLI 均可使用。Codex 也支持 GPT-5.3-Codex 和 GPT-5.3-Codex-Spark(后者速度可达 1000+ token/s)。

二、桌面端 Codex:开箱即用的图形化工作台

桌面端的哲学是"一切皆可点"——你很少需要手动编辑配置文件。点击左下角头像/齿轮 → Settings,所有设置都在 GUI 里。

2.1 桌面端 Settings 速览

设置分类 关键选项 建议
General Prevent sleep while running ✅ 开启——长任务时电脑休眠会导致 Codex 中断
General Detail level Coding mode——可以看到 Codex 具体执行了哪些命令
General Follow-up behavior 开启——Codex 完成任务后主动问"还需要我做什么?"
Configuration Approval policy On request——涉及文件修改和命令执行时征求同意
Configuration Sandbox mode Workspace write——Codex 可在工作区内自由读写,但出不去
Configuration Model GPT-5.5(Pro/Max 用户),日常用 High 推理强度
Personalization Personality Pragmatic(简洁直接)或 Friendly(更亲和)
Personalization Custom instructions 最重要的一项——见下文 2.2
Appearance Theme Light / Dark / System,还有色盲友好主题
Appearance Avatar 可设置一个浮动头像,Codex 在后台跑任务时你能在桌面上看到它

codex常规设置

2.2 个性化——自定义指令如何写得精简高效

桌面端入口:Settings → Personalization → Custom instructions

codex个性化

这里写的内容会被写入 ~/.codex/AGENTS.md(全局级别),影响你在这台机器上所有项目的所有会话。所以只放真正通用的规则。

精简高效的核心原则:

❌ 不要写 ✅ 要写
"请你尽量写出高质量的、符合最佳实践的代码" "TypeScript 严格模式,禁止 any;React 函数组件 + Hooks"
"认真对待每一个细节" "改完代码后自动运行 pnpm typecheck && pnpm lint"
"使用合适的错误处理方式" "API 层统一用 Result<T, AppError> 模式,不抛裸异常"
长篇架构文档 放在项目 docs/ 下,需要时用 @docs/arch.md 引用

一份实用的全局自定义指令示例:

## 沟通
- 用中文回答,代码注释用英文
- 先给方案概述(2-3 句),再写代码
- 涉及架构决策时,列出选项和 trade-off,让我选

## 编码习惯
- TypeScript 严格模式,禁止 any
- 不写 TODO 注释——要么实现完整,要么在 PR 描述中说明
- 安装新依赖前先问我
- 绝不在代码中硬编码密钥和 Token

## 安全
- 不修改 .env 和 production 配置文件
- 涉及数据库 migration 必须先确认

一句话口诀:自定义指令不是写给 AI 的情书,是你给它列的操作清单。每一条都应该是可验证的——"我能在做完后跑一条命令来确认它遵守了吗?"

2.3 桌面端独有功能:Plugins、Automations、多 Agent

桌面端有一些 CLI 不具备或体验差异很大的功能:

功能 干什么用 入口
Plugins 一键安装 Skills、MCP 服务器、App 集成(GitHub、Slack、Notion 等 90+ 插件) 左侧栏 Plugins 图标
Automations 定时任务——比如每天 9:00 让 Codex 检查 PR、生成日报 左侧栏 Automations 图标
多 Agent 并行 同时跑多个 Agent 处理不同任务 新建 Chat 即可自动分配
Projects 按项目组织会话,各自的上下文和配置独立 左侧栏 Projects
内置 Terminal 每个线程有独立终端,跑测试、启 dev server 不用切换窗口 线程内 Terminal Tab

三、CLI 版 Codex:终端极客的进阶武器

如果你更喜欢终端操作(或者需要在 CI/脚本中使用 Codex),CLI 版本提供了更细粒度的控制。

3.1 基本启动方式

codex                  # 启动交互式 TUI
codex "解释这个项目"     # 带初始 prompt 启动
codex exec "检查类型"    # 非交互模式,执行一次后退出
codex update            # 更新到最新版

3.2 CLI 常用参数

参数 简写 作用 示例
--model -m 指定模型 codex -m gpt-5.5
--sandbox -s 沙箱策略 codex -s workspace-write
--ask-for-approval -a 审批时机 codex -a on-request
--full-auto workspace-write + on-request 一键组合 codex --full-auto
--image -i 附图片 codex -i error.png "修这个"
--search 启用实时联网搜索 codex --search "查最新 API"
--profile -p 加载预设配置 Profile codex -p review
--cd -C 指定工作目录 codex -C ./packages/api
--add-dir 添加额外工作目录 codex --add-dir ../shared-lib

3.3 CLI 用户什么时候需要碰 config.toml

桌面端用户基本不需要手动编辑 ~/.codex/config.toml,因为 Settings GUI 已经覆盖了 90% 的常见配置。但 CLI 用户在以下场景可能需要直接编辑:

  • 使用非 OpenAI 模型(如通过 LiteLLM 代理接入其他模型)
  • 配置 MCP 服务器(虽然桌面端有 GUI,但 CLI 用户只能写文件)
  • 精细化 HooksPreToolUse / PostToolUse / SessionStart 等生命周期钩子)
  • 企业管控:管理员通过 requirements.toml 强制安全策略
  • 创建多个 Profile(如 dev / review / ci),用 --profile 切换

一个简洁的 ~/.codex/config.toml 示例:

model = "gpt-5.5"
model_reasoning_effort = "high"
approval_policy = "on-request"
sandbox_mode = "workspace-write"
web_search = "cached"
personality = "pragmatic"

[profiles.review]
model_reasoning_effort = "medium"

[profiles.quick]
model_reasoning_effort = "low"

注意config.toml 的优先级低于 CLI 参数,高于桌面端 GUI 设置。如果你同时使用桌面端和 CLI,建议以桌面端 GUI 为主,config.toml 只放 GUI 覆盖不到的项。

3.4 CLI 典型工作流

# 日常开发
codex --full-auto

# 代码审查(只读 + 每次确认)
codex -s workspace-write -a on-request "审查 src/ 代码"

# 脚本自动化
codex exec "检查 TypeScript 类型错误" --json

# 多仓库协作
codex --cd apps/frontend --add-dir ../backend --add-dir ../shared

# 贴截图 Debug
codex -i error.png "这个报错怎么修?"

四、AGENTS.md 撰写指南:让 Codex 真正懂你

AGENTS.md 是 Codex 的持久化上下文——每次会话启动时自动加载。桌面端和 CLI 共用同一套机制。

4.1 加载链与优先级

Codex 按以下顺序查找 AGENTS.md

~/.codex/AGENTS.md              ← 全局个人偏好(桌面端 Settings → Personalization 写入的)
  └── 项目根/AGENTS.md            ← 项目级规则(建议提交到 Git 给团队共享)
        └── 子目录/AGENTS.md       ← 模块/目录级细化
  • 离当前工作目录越近的文件,优先级越高
  • 同目录存在 AGENTS.override.md 时,完全替代同目录的 AGENTS.md(适合临时实验)
  • 桌面端 Settings → Personalization → Custom instructions 编辑的就是 ~/.codex/AGENTS.md

4.2 该写什么、不该写什么

✅ 推荐写

# AGENTS.md

## 技术栈
- 前端:React 18 + TypeScript 5 + Tailwind CSS 3
- 后端:Node.js + Express 4 + Prisma + PostgreSQL
- 测试:Vitest(单元)+ Playwright(E2E)
- 包管理:pnpm

## 启动与验证
- 安装依赖:pnpm install
- 启动 dev server:pnpm dev(端口 3000)
- 类型检查:pnpm typecheck
- 运行测试:pnpm test
- Lint:pnpm lint

## 编码规范
- TypeScript 严格模式,禁止 any
- React 函数组件 + Hooks,不用 class
- API 路由放在 src/app/api/,遵循 App Router 约定
- 每个组件对应一个 .test.tsx

## 安全
- 绝不硬编码密钥
- 修改 DB Schema 前必须确认
- 涉及认证/权限的改动,先出方案再看代码

❌ 不该写

不该写的内容 原因 正确做法
长文档、API 参考 占上下文窗口,大部分时候用不到 docs/,需要时 @docs/api.md 引用
密钥和 Token 安全隐患,可能被提交到 Git .env,权限中禁止 Codex 读取
格式化规则(缩进/引号等) 应让工具自动执行,不靠 AI 遵守 Prettier/ESLint + Hooks 自动格式化
"认真对待每个细节"等空话 占 token 无实际约束 换成可验证命令:"改完后跑 pnpm typecheck"

4.3 进阶:让 AGENTS.md 持续进化

"两次犯同一个错就加规则"——Codex 犯一次错,会话中指正它;同一个错犯第二次,写入 AGENTS.md

但要定期清理——每月回顾一次,删掉过时或不再需要的条目。一个 40 行的 AGENTS.md 比一个 200 行的更有效。

五、Skills 生态系统:去哪里找、怎么选、如何取舍

Skills 是 Codex 的"插件"——Markdown 格式的可复用指令包,Codex 启动时自动发现元数据,需要时才加载完整内容。桌面端和 CLI 共用同一套 Skills 目录~/.codex/skills/)。

5.1 Skills 核心概念

~/.codex/skills/              ← 个人 Skills(全局可用)
  └── my-skill/
        └── SKILL.md          ← 必需:name、description、触发条件、执行步骤
        └── scripts/          ← 可选:辅助脚本
        └── references/       ← 可选:参考资料

.codex/skills/                 ← 项目 Skills(随仓库共享给团队)

Skills 使用渐进式披露:启动时只加载 name + description(元数据),只有任务匹配时才拉取完整指令。即使装 50 个 Skill,真正占上下文的也只有被激活的那一两个。

5.2 去哪里搜寻 Skills?(已逐一验证)

平台 地址 说明
CocoLoop(中文) hub.cocoloop.cn 中文友好,含 CLS 安全评级,第三方 Skill 商店
Firecrawl 精选 firecrawl.dev/blog/best-codex-skills 含详细评测 + 安装命令 + 使用示例,2026 年持续更新
Composio Top 10 composio.dev/content/top-codex-skills 真实使用案例测试过的 10 个 Skills
LobeHub lobehub.com/skills 500+ Skills,分类清晰,跨 Agent 通用
FAOS Marketplace faosx.ai/open-source 526 个免费 Skills,Apache 2.0,覆盖工程/产品/增长/数据
OpenAI 官方渠道 桌面端 Plugins 面板搜索安装 最安全,官方审核
安装器方式 会话中 $skill-installer <名称> 官方推荐:$skill-installer gh-fix-ci
npx 方式 npx skills add <repo> --skill <name> CLI 通用:npx skills add mattpocock/skills --skill handoff

5.3 经过验证、值得长期使用的 Skills

以下 Skills 已在多个独立来源(Composio、Firecrawl、社区评测、YouTube 实测)中得到验证:

Skill 干什么用 安装方式 推荐理由
grill-me 以苏格拉底式提问对你的方案进行 60 连问 npx skills add mattpocock/skills --skill grill-me 在写代码之前先锁定需求,避免"做完了才发现理解错了"
handoff 把当前会话压缩成交接文档 npx skills add mattpocock/skills --skill handoff 上下文满了?一键生成文档,新会话无缝继续
frontend-design 生成不像"AI 批量生产"的前端 UI npx skills add vercel-labs/agent-skills --skill frontend-design 避免千篇一律的 AI-slop 风格,110k+ 周安装量
Firecrawl 联网搜索 + 抓取 + 爬取 + 浏览器操作 npx -y firecrawl-cli@latest init --all --browser 做调研时查最新文档,不靠训练数据瞎猜
gh-fix-ci 诊断并修复 GitHub Actions CI 失败 $skill-installer gh-fix-ci CI 红了不用自己翻日志
yeet 一键 stage → commit → push → 开 PR $skill-installer yeet 省掉四次手动操作
gh-address-comments 读取 PR Review 评论并批量修改 $skill-installer gh-address-comments 逐个处理 Review 意见太累,批量解决
excalidraw 文字描述转流程图/架构图 npx skills add excalidraw/claude-code --skill excalidraw "把刚才讨论的微服务架构画成图"
superpowers 子 Agent 驱动的完整开发工作流 桌面端 Plugins 面板搜索安装 TDD + Agent 审查 + 迭代,给 Codex 装上工程骨架
skill-creator Codex 内置:帮你创建新 Skill 无需安装,直接 $skill-creator 跟它描述需求,帮你生成完整 SKILL.md

小剧场:花 30 分钟跟 Codex 讨论支付模块架构,聊得热火朝天。第二天打开想继续——上下文满了。装了 handoff 之后,一句 handoff 自动生成包含所有决策、待办、技术选型理由的交接文档,新会话打开直接续上,仿佛从未中断。

5.4 Skills 装太多了怎么办?

Skills 不是越多越好。保持在 15-20 个真正高频使用的,体验最佳。

保留 / 删除四标准:

标准 判断逻辑
使用频率 一周用不到一次的,删
触发重合 两个 Skill 干差不多的事,留更准的那个
可被内置替代 Codex 新版可能已原生支持(如 2025 年的 web-search Skill,2026 年已内置)
维护活跃度 6 个月没更新的,API 可能已变

实战:每月在会话中输入 /skills 列出所有已安装的 Skills,逐个过——名字都看着陌生的直接删。

六、Record & Replay:Mac 用户的"录一次,用一生"

6.1 这是什么?

2026 年 6 月 18 日发布的 Codex macOS 桌面端独占功能。一句话:你在 Mac 上做一遍操作,Codex 边看边学,然后把它变成可复用的自动化 Skill

  • 📅 发布时间:2026 年 6 月 18 日
  • 💻 平台:macOS 桌面端独占(Windows / CLI 暂不支持)
  • 🌍 地区限制:欧洲经济区、英国、瑞士暂不可用
  • 💰 订阅:ChatGPT Plus($20/月)起
  • 🔧 前置条件:需启用 Computer Use + Google Chrome 插件

01-record-replay-concept

6.2 什么场景最适用?

✅ 适合 ❌ 不适合
每月重复的报销流程 步骤每次都不同的探索性任务
定期下载固定报表 涉及金融敏感操作的流程
按模板发布视频/文章 需要大量人工判断的决策
标准化创建 GitHub Issue 一次性操作

6.3 操作步骤

  1. 打开 Codex macOS App
  2. 进入左侧栏 Plugins → 点 + → 选 Record a skill
  3. 审阅建议 prompt,补充上下文,提交
  4. Codex 请求录屏权限 → 批准
  5. 开始演示工作流(像平常一样操作就行)
  6. 完成后点菜单栏停止按钮,或直接说"我完成了"
  7. Codex 分析录屏 → 自动生成 SKILL.md(可编辑!)

03-three-ways-skill

关键认知:Record & Replay 生成的不是"像素级宏录制",而是语义级意图描述——它理解你想完成什么,而不是记录你点了哪些坐标。这意味着下次界面布局变了,它仍然能适应。

6.4 录制后可编辑

生成的 SKILL.md 完全可以手动修改——调整步骤、添加验证条件、修改输入参数。本质上就是一个文本文件,跟手写的 Skill 没有任何区别,只是"作者"换成了你的录屏。

02-record-vs-session-replay

七、日常使用技巧与快捷键

7.1 桌面端 / CLI 通用的斜杠命令

在会话中输入 / 触发命令面板:

命令 作用 场景
/model 切换模型 简单任务切轻量模型,省 token
/new 开启全新会话 换个不相关的任务
/resume 恢复历史会话 继续昨天的重构
/fork 从当前点分叉新会话 "这个方案不确定,分叉出去试试"
/compact 压缩对话历史 上下文快满了
/side 快速旁路提问 查个 API 用法,不污染主对话
/status 查看当前模型、策略、Token 用量 心里有数
/copy 复制 Codex 最近一次完整输出
/clear 清屏(不新建会话)
/skills 列出所有已安装 Skills
/theme 切换配色 支持色盲友好主题

7.2 三种前缀

前缀 作用 示例
/ 斜杠命令或调用自定义 Prompt /model gpt-5.5
! 绕过对话直接执行 Shell 命令 ! npm test
@ 引用文件/目录(支持 Glob) @src/services/UserService.ts

技巧:多用 ! 前缀跑命令,而不是在 prompt 里描述"请帮我运行 npm test 并分析结果"。前者 Codex 直接读到输出,后者要在对话中转一圈,多烧 token。

7.3 通用快捷键

快捷键 作用
Esc Esc 空输入框双击 Esc:编辑上条消息。继续按可回溯更早的消息,按 Enter 从该点分叉
Ctrl+O 复制 Codex 最新完整输出
Ctrl+L 清屏(保留对话历史)
Tab Codex 运行期间按 Tab:排队输入下一条消息
Ctrl+C 中断当前生成
Ctrl+D 退出会话(CLI)
Cmd+, 打开桌面端 Settings
Alt+, / Alt+. 降低/提高推理强度

7.4 提示词三技巧

① 让 Codex 先采访你

我想给项目加用户权限系统,但还没想清楚细节。先采访我,把需求搞清楚了再动手。

② 复杂任务先出计划

我需要重构 UserService。先出 RFC 风格计划:拆分策略、文件结构、每步风险点。我确认后再执行。

③ 定义"完成"标准

优化 UserProfile 组件:减少不必要的 re-render,首屏加载 < 1 秒,现有 12 个测试全部通过。

八、小结

Codex 的威力不在于模型,而在于你花了多少心思去"养"它。一个花 30 分钟写好 AGENTS.md、选好 Skills、调好 Settings 的开发者,效率可能比"开箱即用"的高 3 倍以上。

优先级清单(按投入回报排序):

优先级 投入 时长 回报
🥇 桌面端 Settings → Personalization → Custom instructions 15 分钟 每次对话都受益
🥈 创建项目 AGENTS.md(技术栈 + 验证命令 + 编码规范) 20 分钟 团队共享,一次写好一直用
🥉 Settings → Configuration:调好审批策略和沙箱模式 5 分钟 不再踩权限坑
4 安装 5-8 个核心 Skills(handoff, grill-me, firecrawl 等) 15 分钟 关键场景效率翻倍
5 (Mac 用户)用 Record & Replay 录 2 个重复任务 10 分钟/个 每周省机械操作时间
6 (CLI 用户)创建 2-3 个 Profile + 精简 config.toml 10 分钟 切换场景不手忙脚乱
7 每月清理 Skills + 回顾 AGENTS.md 15 分钟/月 防止配置腐烂

你在养一个虚拟同事,不是买了一个工具。对它投入的每一分钟,都会在未来的会话中加倍奉还。


本文基于 Codex 2026 年 7 月最新版本(桌面端 App + CLI),当前默认模型为 GPT-5.5。部分功能(如 Record & Replay)有地区和平台限制。第三方 Skills 由社区开发者提供,安装前请查看安全评级。更多内容请参阅 OpenAI Codex 官方文档

posted @ 2026-07-05 12:31  only赟  阅读(0)  评论(0)    收藏  举报