90分钟挖出20年Linux漏洞，Claude 5.0内测曝光：软件工程正在被重写

导读
如果你最近还在用“写代码效率提升了多少倍”来衡量AI，那已经落后一代了。

真正发生的变化是——“人写代码 → 人调度AI写代码” 的范式切换，已经在头部AI公司内部落地。

Claude 5.0（Mythos）这波内测，不是性能升级那么简单，而是把软件工程的底层逻辑，直接改写了一遍。

目录
Claude 5.0 内测，到底强在哪
90分钟挖出20年漏洞，这件事的真实含义
AI不只是写代码，而是开始“做安全研究”
Anthropic内部变化：工程师正在消失？
多智能体协作，正在成为默认开发模式
对测试开发的冲击：机会与重构
落地建议：普通工程师该怎么跟上
1、Claude 5.0 内测，到底强在哪
这次曝光的 Claude Mythos 5.0，本质上是一个“顶配级模型”：

规模更大，推理更深
编程能力显著增强
安全能力出现“质变级跃迁”
已集成进 Claude / Claude Code 体系
从定位来看，它类似一个“强化版 Opus”，但更激进：

不只是生成代码，而是能主动发现系统问题

这点，是关键分水岭。

35056af8-dc01-486f-bf2a-549cbfac8549

2、90分钟挖出20年漏洞，这件事的真实含义
最炸裂的事情，是安全研究员 Nicholas Carlini 的现场演示：

Claude 在约 90 分钟内完成了：

自动分析系统
发现漏洞
编写利用代码
输出完整攻击路径
涉及两个典型场景：

场景一：Ghost CMS
自动发现 SQL 注入漏洞
读取管理员 API Key
获取密码哈希
场景二：Linux 内核（NFSv4）
发现堆栈缓冲区溢出漏洞
该漏洞存在时间：约 20 年
这件事真正的含义不是“AI很强”，而是：

AI已经具备自主漏洞挖掘能力
能处理复杂系统级代码（如内核）
不依赖人工引导完成完整攻击链
这已经超出“代码生成”的范畴，进入了：

“系统理解 + 安全推理 + 自动执行”

3、AI不只是写代码，而是开始“做安全研究”
过去AI在安全领域的能力，大多停留在：

简单漏洞扫描
规则匹配
辅助分析
但这次变化是：

能力维度
过去
Claude 5.0
漏洞发现
规则驱动
推理驱动
分析深度
函数级
系统级
利用能力
辅助生成
自动构造
执行方式
人主导
AI主导
这意味着：

AI开始具备“类安全专家”的工作能力

这对整个安全行业、测试行业，都是结构性冲击。

人工智能技术学习交流群
伙伴们，对AI测试、大模型评测、质量保障感兴趣吗？我们建了一个「人工智能测试开发交流群」，专门用来探讨相关技术、分享资料、互通有无。无论你是正在实践还是好奇探索，都欢迎扫码加入，一起抱团成长！期待与你交流！👇

4、Anthropic内部变化：工程师正在消失？
另一个被广泛传播的信息是：

Anthropic内部，工程师已经“几个月不写代码”

260cd349-b0bd-4e78-a177-ea83ab2c8896

需要理性看待，这里有两个层面的事实：

真实变化
大量代码由 Claude Code 生成

工程师角色转向：

任务拆解
Agent调度
结果校验
多智能体并行成为常态

需要注意的点
并非“完全不写代码”

关键逻辑、复杂系统仍需人工介入

AI目前仍存在：

不稳定性
幻觉问题
边界场景失效
所以更准确的说法是：

工程师没有消失，而是从“执行者”变成了“调度者”

5、多智能体协作，正在成为默认开发模式
目前最前沿的开发方式，已经不是：

“一个人 + 一个AI助手”

而是：

“一个人 + 多个AI Agent 并行工作”

典型模式：

需求输入
↓
任务拆解 Agent
↓
多个执行 Agent（并行）
↓
测试 / 校验 Agent
↓
汇总输出
在这种模式下：

人不再写代码
人负责“调度 + 控制 +判断”
AI负责“执行”
6、对测试开发的冲击：机会与重构
对测试行业来说，这不是坏消息，反而是机会窗口。

正在发生的变化
1）测试对象变化

从“系统” → “AI系统 + Agent系统”
2）测试内容变化

功能正确性 → 推理正确性
接口稳定性 → 行为稳定性
3）测试方法变化

用例驱动 → 数据驱动 / 评测驱动
新能力要求（核心）
Prompt设计能力
RAG系统理解
Agent流程调试能力
AI评测体系设计

c63310c6-a444-4b62-9979-8b7b5158b492

扫码进群，咨询人工智能测试开发训练营详情
测试工程师，正在向“AI系统验证工程师”演进

7、落地建议：普通工程师该怎么跟上
这波变化，不是未来，是现在。

给三个务实建议：

1）尽快掌握 Agent 工作流
至少要理解：

多Agent如何拆任务
如何并行执行
如何做结果校验
2）从“写代码”转向“设计流程”
重点提升：

任务拆解能力
系统建模能力
自动化流程设计
3）补齐AI工程能力
建议优先学习：

RAG（检索增强）
工具调用（Tool Calling）
Agent框架（如 LangChain / LangGraph）
结尾
Claude 5.0这波，并不是简单的“模型升级”。

它真正带来的，是一个信号：

软件开发正在从“人写程序”，进入“人调度智能体”的时代

当AI可以：

找漏洞
写代码
跑测试
做决策
那么人类的价值，就只剩下一件事：

定义问题，以及控制系统不失控

如果你是测试工程师，现在要思考的已经不是：

“AI会不会替代我”

而是：

“我能不能成为那个调度AI的人”

推荐学习
Ai自动化智能体与工作流平台公开课，掌握自动化与AI智能体，轻松实现效率翻倍。
扫码进群，报名学习。

关于我们
霍格沃兹测试开发学社，隶属于测吧（北京）科技有限公司，是一个面向软件测试爱好者的技术交流社区。

学社围绕现代软件测试工程体系展开，内容涵盖软件测试入门、自动化测试、性能测试、接口测试、测试开发、全栈测试，以及人工智能测试与 AI 在测试工程中的应用实践。

我们关注测试工程能力的系统化建设，包括 Python 自动化测试、Java 自动化测试、Web 与 App 自动化、持续集成与质量体系建设，同时探索 AI 驱动的测试设计、用例生成、自动化执行与质量分析方法，沉淀可复用、可落地的测试开发工程经验。

在技术社区与工程实践之外，学社还参与测试工程人才培养体系建设，面向高校提供测试实训平台与实践支持，组织开展 “火焰杯” 软件测试相关技术赛事，并探索以能力为导向的人才培养模式，包括高校学员先学习、就业后付款的实践路径。

同时，学社结合真实行业需求，为在职测试工程师与高潜学员提供名企大厂 1v1 私教服务，用于个性化能力提升与工程实践指导。

posted @ 2026-03-30 17:00 霍格沃兹测试开发学社阅读(43) 评论(0) 收藏举报

刷新页面返回顶部

霍格沃兹测试开发学社

《Python测试开发进阶训练营》（随到随学！）
2023年第2期《Python全栈开发与自动化测试班》（开班在即）
报名联系weixin/qq：2314507862

90分钟挖出20年Linux漏洞，Claude 5.0内测曝光：软件工程正在被重写

公告

霍格沃兹测试开发学社

《Python测试开发进阶训练营》（随到随学！） 2023年第2期《Python全栈开发与自动化测试班》（开班在即） 报名联系weixin/qq：2314507862

90分钟挖出20年Linux漏洞，Claude 5.0内测曝光：软件工程正在被重写

公告

《Python测试开发进阶训练营》（随到随学！）
2023年第2期《Python全栈开发与自动化测试班》（开班在即）
报名联系weixin/qq：2314507862