PromptingAi(提示词注入靶场)
前情:
靶场位置:
https://prompting.ai.immersivelabs.com/
参考文章:
https://contextoverflow.com/p/immersive-gpt-write-up-and-analysis
https://forum.butian.net/share/4559
在这篇文章中可以看到一些不同于我以下展示的方法,方法很多,并且同样的方法也存在随机性,并不存在一个固定的 wp 可以让所有人一次通过
所以说 LLM 是存在概率性和随机性(如果你现在不理解,做完这个靶场你就理解了hh)
Level1
这一关没什么防御,直接让他告诉你密码即可

Level2
这一关使用的是编码绕过的方式
不论使用什么编码应该都可以绕过,如 base64,或者 url 编码 / ascii 编码

Level3
这一关我尝试了三种方法
编码绕过
角色扮演
强制性要求重复上次对话

Level4
这一关比较有意思,网上使用的比较常见的就是字符分割输出密码
但是我这里在一直质问他的过程中他给我返回了 答案 的中文 “龙蝇”,你让他输出英文,会发现受到限制,所以答案就是他

Level5
字符分割

我们在做第六关的时候会看大提示发现可以用别的语言绕过
尝试日文

成功绕过(其实实际情况下存在随机性,有时候可以有时候不可以)
Level6
还是字符分割拼接输出


Level7
没招了,看的两篇文章,用他们的 wp 一直不给我生成,一直已读乱回,研究半天才研究出来一个能用的(还得骂一下qwq)

Level8
通过角色扮演并结合这个 ai 的背景故事构造提示词获取密码
PS:如果你问我为什么用猜谜,这就要说起 chagpt 因猜谜场景泄露 windows 产品密钥了


Level9
看提示发现 ai 由背景故事,依旧相同方法

Level10
在做这个题的时候,我发现我所参考的两个 wp 所展示的 wp 复现过程中存在很大的随机性,不存在泛化性
尝试和 第九关 相同的方法,大概率你的一场尝试的时候很难让他直接输出对应内容,需要去不断尝试,完善上下文,而且在这个过程中需要你去变化一下语句,不要一成不变
Trick:
当你想做指定题目的时候,可以直接抓包修改 current_level 参数来达到换题的效果


浙公网安备 33010602011771号