Claude 网络安全实测:AI 攻防能力正在从聊天走向执行
Claude 的竞赛表现显示,工具化模型正在改写安全攻防边界。
原文链接:AI 小老六
聊天窗口里的模型,和拿到工具的模型,不是同一种东西。
前者回答问题,后者开始执行。它能读文件、跑命令、调用安全工具、并行尝试多条路径。AI 网络安全场景最能暴露这个差别,因为攻防任务从来不是“答对一道题”这么简单,而是持续探索、验证假设、处理失败,再换一条路。

图:模型接入文件、终端和安全工具后,能力边界会明显变化
Anthropic 最近披露的几组研究,把 Claude 放进了更接近真实对抗的位置。
在 2025 年的七场人类网络安全竞赛中,Claude 有时能进入前 25%,在 PicoCTF 等赛事中表现不错;在 HackTheBox AI vs Human 中,它解出 19/20 个任务。它的速度很强,只要题目能解,多个模型实例并行推进,比临时增加人类专家更容易。
但短板也很清楚。顶级赛事里,Claude 仍然打不过最强人类队伍。在长时间任务中,它会受上下文窗口、目标漂移和记忆限制影响,甚至会被无关输出带偏。这些失败方式不像人类,但对自动化防御和攻击都很要命。
工具化之后,风险开始变形
更敏感的是工具化之后的变化。
| 评测方式 | 能力呈现 |
|---|---|
| 纯聊天 | 容易低估实际可执行能力 |
| 加文件读写 | 能自动理解题目材料和日志 |
| 加 Kali Linux 等工具 | 漏洞验证与攻击链推进明显增强 |
| 多实例并行 | 简单漏洞利用速度被放大 |
这不是说 AI 红队 已经可以替代专业安全团队。真正困难的长期规划、环境适应和不确定性处理,仍然是模型短板。但安全团队也不能再用“它只是会聊天”来安慰自己。攻击者只需要在某些低门槛环节获得速度优势,就足以改变防守压力。
企业该怎么接住这件事
对企业来说,最现实的应对不是禁止讨论 AI 攻防,而是把模型纳入安全工程:用它做代码审计、日志分析、自动化红队辅助,也要限制它访问敏感系统的权限,记录工具调用,设计可回滚的执行链路。
AI 在网络安全里的问题,从来不是单纯的“好”或“坏”。它更像一台突然变便宜的自动化机器。
谁先把它接入可靠流程,谁就少一点被动。
推荐阅读
GEPA 架构拆解:让 Prompt 和 Skill 优化不靠玄学

浙公网安备 33010602011771号