摘要:
Abstract Background: 目前的jailbreak mutator方式更集中在语义level,更容易被防御措施检查到 本文: AdaPPA (Adaptive Position Pre-Filled Jailbreak Attack) Task: adaptive position 阅读全文
posted @ 2025-01-15 23:13
雪溯
阅读(43)
评论(0)
推荐(0)
摘要:
Abstract background: 本文认为现有的jailbreaking方法要么需要人力,要么需要大模型,本文不需要 本文: ReNELLM Task: Jailbreaking LLM blackbox Method: Prompt Rewriting, Scenario Nesting, 阅读全文
posted @ 2025-01-15 23:12
雪溯
阅读(85)
评论(0)
推荐(0)

浙公网安备 33010602011771号