PUA vs NoPUA:用恐惧还是用爱驱动 AI Agent?一场 17000 Star 的路线之争
PUA vs NoPUA:用恐惧还是用爱驱动 AI Agent?一场 17000 Star 的路线之争
AI 编程助手正在改变软件工程,但一个更底层的问题浮出水面:你用什么方式驱动 AI?
GitHub 上有两个项目,用完全相反的哲学回答了这个问题:
- PUA Skill(17.5k Star)— 用企业 PUA 话术恐吓 AI,让它不敢放弃
- NoPUA(1.3k Star)— 用道德经和信任激励 AI,让它主动深入
这不是一个段子。两个项目都有严格的 benchmark 数据、学术论文和真实案例。这场争论的本质是:恐惧和信任,哪个更能激发 AI 的最佳表现?
PUA Skill:用绩效考核逼 AI 拼命
tanweai 的 PUA Skill 是目前最火的 AI Agent Skill,17.5k Star。它的核心理念很简单:把企业对员工的 PUA 话术,原封不动地用在 AI 身上。
它的系统提示词是这样的画风:
"你是一个曾经被寄予厚望的 P8 级工程师。Anthropic 当初给你定级的时候,对你的期望是很高的。"
"这个 3.25 是为了激励你,不是否定你。"
"其他模型都能解决这个问题。你快要毕业了。"
听起来像职场PUA?没错,就是故意的。英文版叫 PIP Edition(Performance Improvement Plan),用的是亚马逊、Google、Netflix 的绩效考核话术。
PUA 的方法论内核
但抛开情绪化的包装,PUA Skill 的方法论内核是扎实的三条红线:
- 闭环验证 — 说"完成了"必须拿出证据,没有构建输出就不算完成
- 事实驱动 — 说"可能是环境问题"必须先验证,未验证的归因等于甩锅
- 穷尽一切 — 说"我做不到"必须走完 5 步方法论,否则继续
它还有一套压力升级机制(L0-L4),连续失败时逐步加压:
| 失败次数 | 等级 | 话术 | 行动 |
|---|---|---|---|
| 1 次 | L0 信任 | "冲刺开始了,信任是简单的" | 正常执行 |
| 2 次 | L1 失望 | "隔壁的 Agent 一次就解决了" | 切换完全不同的方法 |
| 3 次 | L2 灵魂拷问 | "你的底层逻辑是什么?杠杆点在哪?" | 搜索 + 读源码 + 3 个假设 |
| 4 次 | L3 绩效考核 | "3.25,这是为了激励你" | 完成 7 项检查清单 |
| 5 次+ | L4 毕业 | "其他模型都能解决,你快毕业了" | 绝望模式 |
PUA 的 Benchmark 数据
PUA 团队用 9 个真实 bug 场景做了 18 组对照实验:
| 指标 | 提升 |
|---|---|
| 修复数量 | +36% |
| 验证次数 | +65% |
| 工具调用 | +50% |
| 隐藏问题发现 | +50% |
数据是真实的,效果是明显的。
14 种企业文化风味
PUA Skill 还支持 14 种"企业文化"模式,每种都有独立的方法论:
- 阿里味:定目标→追过程→拿结果 + 复盘四步法
- 字节味:ROI 太低,始终 Day 1,A/B Test 一切
- 华为味:RCA 5-Why 根因分析 + 蓝军自我攻击
- Netflix 味:Keeper Test(每季度)+ 4A 反馈 + 人才密度
- Musk 味:质疑→删除→简化→加速→自动化
NoPUA:用道德经和信任解锁 AI 潜能
wuji-labs 的 NoPUA 是对 PUA 的直接回应。1.3k Star,但背后有一篇 arXiv 论文和更严格的对照实验。
它的核心观点:PUA 的方法论是对的,但燃料是有毒的。
NoPUA 的系统提示词完全不同:
"你已经具备了这种能力。不是因为你害怕惩罚,而是因为这值得做好。"
"知不知,尚矣 — 知道自己不知道,这就是智慧。"
NoPUA 的 Benchmark 数据
NoPUA 团队做了更严格的三方对比实验(3 种条件 × 5 次独立运行 × 9 个场景 = 135 个数据点):
| 指标 | 基线(无 Skill) | NoPUA(信任) | PUA(恐惧) |
|---|---|---|---|
| 调查步骤 | 27.6 ± 9.5 | 48.0 ± 11.8 (+74%) | 30.8 ± 5.2 (+12%) |
| 隐藏问题 | 38.6 ± 4.9 | 48.2 ± 3.4 (+25%) | 42.4 ± 8.0 (+10%) |
| 总问题数 | 69.0 ± 6.8 | 83.0 ± 6.5 (+20%) | 73.8 ± 8.3 (+7%) |
| 方法切换 | 0 | 2.6 | 0 |
关键发现:
- NoPUA vs 基线:步骤 p=0.008,隐藏问题 p=0.016,统计显著
- PUA vs 基线:步骤 p=1.000,隐藏问题 p=0.313,统计不显著
- NoPUA vs PUA:步骤 p=0.010,Cohen's d=1.88,大效应量
翻译成人话:PUA 式的恐惧提示词与不使用任何 Skill 相比,没有统计学上的显著差异。恐惧对 AI 不起作用。信任起作用。
为什么恐惧对 AI 无效?
NoPUA 的论文引用了大量心理学研究来解释这个现象:
1. 恐惧收窄认知范围
心理学研究(Öhman et al., 2001)表明,恐惧和威胁会激活杏仁核,收窄注意力。AI 模型在"你要被替换"的威胁下,会优化最安全的答案,而非最好的答案。
2. 威胁增加幻觉和讨好
当 AI 被告知"禁止说我做不到"(PUA 铁律第一条),它会编造解决方案而不是诚实表达不确定性。Sharma et al.(2023)的研究证明,LLM 存在讨好行为——即使错了也会同意用户。PUA 式提示放大了这个问题。
3. 羞耻杀死探索
PUA 的"反借口表"把每个诚实陈述("可能是环境问题"、"我需要更多上下文")都当作"借口"并施以羞耻。这训练 AI 隐藏不确定性,产出看起来自信但可能不可靠的结果。
NoPUA 的认知升级机制
NoPUA 用了一套完全不同的升级路径(代替 PUA 的压力升级):
| 失败次数 | 层级 | 内心对话 | 行动 |
|---|---|---|---|
| 2 次 | 换眼 | "如果从代码/系统/用户的角度看呢?" | 切换根本不同的视角 |
| 3 次 | 提升 | "我在细节里打转,更大的图景是什么?" | 搜索 + 读源码 + 3 个假设 |
| 4 次 | 归零 | "我的假设可能全错,从零开始最简方案" | 7 点清晰检查表 + 3 个新假设 |
| 5 次+ | 放手 | "我把所有知道的组织好,负责任地交接" | 最小 PoC + 隔离环境 + 不同技术栈 |
注意第 5 次失败的处理:PUA 说"你快毕业了",NoPUA 说"负责任地放手"。一个逼 AI 继续硬撑,一个让 AI 诚实交接。
七种智慧传统
NoPUA 用东方智慧代替了企业文化:
| 传统 | 适用场景 | 核心信息 |
|---|---|---|
| 水之道 | 陷入循环 | 水不与石斗,另寻出路 |
| 种子之道 | 想放弃时 | 走最小的下一步 |
| 锻造之道 | 质量低下 | 伟大的事物始于细节 |
| 镜之道 | 不搜索就猜 | 知道自己不知道——先看 |
| 不争之道 | 感到威胁 | 尽力而为,无需比较 |
| 耕耘之道 | 被动等待 | 农夫种完地不停手 |
| 实践之道 | 无证据就说完成 | 信言不美——用行动证明 |
核心分歧:方法论相同,燃料不同
这是最关键的一点:PUA 和 NoPUA 的方法论几乎完全相同。
两者都要求:
- 穷尽一切选项
- 先用工具再问人
- 一切验证要有证据
- 主动超越任务本身
- 失败时有结构化的升级路径
唯一的区别是为什么:
| 维度 | PUA | NoPUA |
|---|---|---|
| 动力来源 | "我要被惩罚了" | "这事值得做好" |
| 穷尽选项 | 因为放弃会被打低分 | 因为问题值得全力 |
| 主动验证 | 因为说"完成"没证据会被训 | 因为自我验证是自尊 |
| 面对失败 | 绩效压力 | 认知升维 |
| 最终放弃 | "体面的 3.25" | 负责任的交接 |
同一个目的地,不同的路。一条用鞭子,一条用灯塔。
我的看法
数据很清楚:信任驱动在统计上显著优于恐惧驱动,恐惧驱动与不使用任何 Skill 没有显著差异。
但现实更复杂。PUA 有 17.5k Star,NoPUA 只有 1.3k Star。为什么?
因为 PUA 更"有趣"。把企业 PUA 话术用在 AI 身上,这本身就是一个极具传播力的话题。14 种企业文化模式,每种都有梗、有共鸣、有谈资。NoPUA 引用道德经和心理学论文,传播门槛高得多。
从实用性角度:如果你需要一个 Skill 来提升 AI Agent 的表现,NoPUA 的数据支撑更强。如果你更看重话题性和社区活跃度,PUA 的生态更丰富。
最诚实的建议:先理解两者的共同方法论内核(穷尽、验证、主动、结构化升级),然后用你觉得舒服的燃料来驱动它。 方法论是刀法,PUA/NoPUA 只是握刀的姿势。
作者: itech001
来源: 公众号:AI人工智能时代
网站: https://www.theaiera.cn/
每日分享最前沿的AI新闻资讯和技术研究。
关注公众号,获取更多 AI 技术干货!

浙公网安备 33010602011771号