2025 年 1月 15 日随笔档案 - 雪溯

2025年1月15日

Proj CJI Paper Reading: AdaPPA: Adaptive Position Pre-Fill Jailbreak Attack Approach Targeting LLMs

摘要： Abstract Background: 目前的jailbreak mutator方式更集中在语义level，更容易被防御措施检查到本文: AdaPPA (Adaptive Position Pre-Filled Jailbreak Attack) Task: adaptive position 阅读全文

posted @ 2025-01-15 23:13 雪溯阅读(50) 评论(0) 推荐(0)

Proj CJI Paper Reading: A Wolf in Sheep’s Clothing: Generalized Nested Jailbreak Prompts can Fool Large Language Models Easily

摘要： Abstract background: 本文认为现有的jailbreaking方法要么需要人力，要么需要大模型，本文不需要本文: ReNELLM Task: Jailbreaking LLM blackbox Method: Prompt Rewriting, Scenario Nesting，阅读全文

posted @ 2025-01-15 23:12 雪溯阅读(91) 评论(0) 推荐(0)

雪溯

总之心情不好的话大概就会来这边做两道OJ，此处顺便储存部分笔记

公告