Claude Code、Codex接管开发流程，测试工程师下一步该做什么？

导读
最近一周，AI开发工具的更新有点密集，而且方向非常一致：

Claude Code 推出了自动决策模式，开始自己决定代码怎么写、文件怎么改 Codex 以终端助手的形式回归，可以直接接管编码任务谷歌开源了 TimesFM，把时间序列预测能力做成基础模型一批推理模型开始开源，工程能力进一步下沉

这些变化叠在一起，其实在指向同一件事：

AI正在从“辅助工具”，变成“可以执行完整开发流程的角色”

从写代码，到运行，再到修复问题，很多环节已经可以自动完成

对开发来说，这是效率问题但对测试来说，是角色问题

测试用例可以自动生成自动化脚本可以自动写 Bug定位越来越依赖模型推理

如果这些事情都被接管了，那测试工程师还剩下什么？

这也是这段时间很多人开始反复在问的问题

目录
这轮AI，变的到底是什么
测试岗位正在被替代的部分
更重要的能力，正在上升
测试工程师的角色正在重构
接下来，测试该往哪里走
一、这轮AI，变的到底是什么
很多测试同学最近都有一个很明显的感受：

需求还没完全理解清楚代码已经生成了一版测试用例甚至都自动出来了

这不是个别工具的问题，而是整个工程模式在变

过去的流程是：

551bdeb1-9c25-4ea6-821f-c76770c31a54

现在正在变成：

8c1d920c-a112-4a66-9bdc-95edbdfde6d0

关键变化不在于某个工具，而在于：

开发、测试、修复，正在被一条自动化链路打通

以 Claude Code 和 Codex 为代表的工具，已经具备：

根据需求生成代码
自动补全核心逻辑
执行代码并根据报错调整
连续迭代直到跑通
这意味着一件事：

工程执行能力，正在被AI接管

二、测试岗位正在被替代的部分
很多人焦虑，其实不是没有原因的

因为测试里一部分工作，确实正在被替代

先看最典型的三块：

测试用例生成
以前需要人工分析需求、设计边界、整理用例

现在 AI可以基于需求直接生成完整测试集

自动化脚本编写
以前需要写代码、调试框架、处理兼容性

现在 AI可以直接生成可运行脚本，并自动修复报错

Bug定位
以前需要反复复现、查日志、定位原因

现在 AI可以分析调用链、日志、上下文，快速定位问题

总结一下：

c6d55586-dfdb-4b77-9c5c-52afe036029a

结论很直接：

测试的执行层，正在被快速压缩

三、更重要的能力，正在上升
但问题在于

测试不会消失，只是核心能力在变化

真正上升的，是下面这三类能力

AI结果的判断能力
AI会生成结果但结果是否正确，需要人来判断

包括：

是否符合业务逻辑
是否存在隐性错误
是否存在幻觉
MIT已经有研究证明，大模型存在明显的顺从性问题

也就是用户说错，它也可能跟着错

这意味着：

AI不是绝对可信，它需要被测试

系统级理解能力
过去测试关注单个功能

现在需要理解：

整个系统如何协作
AI在系统中的位置
数据如何流动
测试的对象，从功能点变成了系统行为

数据与评估能力
AI系统不是确定性的

同一个输入可能产生不同输出

这就带来一个新问题：

怎么评估对不对

测试需要开始关注：

数据集设计
评估指标设计
输出稳定性
人工智能技术学习交流群
伙伴们，对AI测试、大模型评测、质量保障感兴趣吗？我们建了一个「人工智能测试开发交流群」，专门用来探讨相关技术、分享资料、互通有无。无论你是正在实践还是好奇探索，都欢迎扫码加入，一起抱团成长！期待与你交流！👇

四、测试工程师的角色正在重构
如果把这些变化合在一起看

测试工程师的角色，其实已经在变

从：

写用例
执行测试
提Bug
变成：

定义测试标准
评估AI结果
设计验证体系
可以抽象成一个结构：

4a2ee632-a26f-441c-91ff-b51ba6487adb

一句话总结：

测试正在从执行者，变成质量决策者

五、接下来，测试该往哪里走
很多人最关心的其实是这个问题：

那我现在应该怎么办

这里给一个比较现实的方向

不要和AI比执行能力
AI在写代码、写用例这件事上效率一定会超过人

继续在这一层卷，只会越来越难

开始理解AI系统
包括：

Agent是怎么工作的
RAG系统如何构建
模型能力边界在哪里
3. 提升判断能力
未来真正稀缺的，不是写代码的人

而是能判断：

这套系统是否可靠的人

结尾
AI已经可以：

写代码生成测试执行流程

但它还做不好一件事：

对结果负责

这正是测试工程师新的价值所在

推荐学习
Ai自动化智能体与工作流平台公开课，掌握自动化与AI智能体，轻松实现效率翻倍。
扫码进群，报名学习。

关于我们
霍格沃兹测试开发学社，隶属于测吧（北京）科技有限公司，是一个面向软件测试爱好者的技术交流社区。

学社围绕现代软件测试工程体系展开，内容涵盖软件测试入门、自动化测试、性能测试、接口测试、测试开发、全栈测试，以及人工智能测试与 AI 在测试工程中的应用实践。

我们关注测试工程能力的系统化建设，包括 Python 自动化测试、Java 自动化测试、Web 与 App 自动化、持续集成与质量体系建设，同时探索 AI 驱动的测试设计、用例生成、自动化执行与质量分析方法，沉淀可复用、可落地的测试开发工程经验。

在技术社区与工程实践之外，学社还参与测试工程人才培养体系建设，面向高校提供测试实训平台与实践支持，组织开展 “火焰杯” 软件测试相关技术赛事，并探索以能力为导向的人才培养模式，包括高校学员先学习、就业后付款的实践路径。

同时，学社结合真实行业需求，为在职测试工程师与高潜学员提供名企大厂 1v1 私教服务，用于个性化能力提升与工程实践指导。

posted @ 2026-04-04 22:35 霍格沃兹测试开发学社阅读(75) 评论(0) 收藏举报

刷新页面返回顶部

霍格沃兹测试开发学社

《Python测试开发进阶训练营》（随到随学！）
2023年第2期《Python全栈开发与自动化测试班》（开班在即）
报名联系weixin/qq：2314507862

Claude Code、Codex接管开发流程，测试工程师下一步该做什么？

公告

霍格沃兹测试开发学社

《Python测试开发进阶训练营》（随到随学！） 2023年第2期《Python全栈开发与自动化测试班》（开班在即） 报名联系weixin/qq：2314507862

Claude Code、Codex接管开发流程，测试工程师下一步该做什么？

公告

《Python测试开发进阶训练营》（随到随学！）
2023年第2期《Python全栈开发与自动化测试班》（开班在即）
报名联系weixin/qq：2314507862