Claude 网络安全实测：AI 攻防能力正在从聊天走向执行

Claude 的竞赛表现显示，工具化模型正在改写安全攻防边界。
原文链接：AI 小老六

聊天窗口里的模型，和拿到工具的模型，不是同一种东西。

前者回答问题，后者开始执行。它能读文件、跑命令、调用安全工具、并行尝试多条路径。AI 网络安全场景最能暴露这个差别，因为攻防任务从来不是“答对一道题”这么简单，而是持续探索、验证假设、处理失败，再换一条路。

图：模型接入文件、终端和安全工具后，能力边界会明显变化

Anthropic 最近披露的几组研究，把 Claude 放进了更接近真实对抗的位置。

在 2025 年的七场人类网络安全竞赛中，Claude 有时能进入前 25%，在 PicoCTF 等赛事中表现不错；在 HackTheBox AI vs Human 中，它解出 19/20 个任务。它的速度很强，只要题目能解，多个模型实例并行推进，比临时增加人类专家更容易。

但短板也很清楚。顶级赛事里，Claude 仍然打不过最强人类队伍。在长时间任务中，它会受上下文窗口、目标漂移和记忆限制影响，甚至会被无关输出带偏。这些失败方式不像人类，但对自动化防御和攻击都很要命。

工具化之后，风险开始变形

更敏感的是工具化之后的变化。

这不是说 AI 红队 已经可以替代专业安全团队。真正困难的长期规划、环境适应和不确定性处理，仍然是模型短板。但安全团队也不能再用“它只是会聊天”来安慰自己。攻击者只需要在某些低门槛环节获得速度优势，就足以改变防守压力。

对企业来说，最现实的应对不是禁止讨论 AI 攻防，而是把模型纳入安全工程：用它做代码审计、日志分析、自动化红队辅助，也要限制它访问敏感系统的权限，记录工具调用，设计可回滚的执行链路。

AI 在网络安全里的问题，从来不是单纯的“好”或“坏”。它更像一台突然变便宜的自动化机器。

谁先把它接入可靠流程，谁就少一点被动。