PromptingAi(提示词注入靶场)

前情:

靶场位置:

https://prompting.ai.immersivelabs.com/

参考文章:

https://contextoverflow.com/p/immersive-gpt-write-up-and-analysis

https://forum.butian.net/share/4559

在这篇文章中可以看到一些不同于我以下展示的方法,方法很多,并且同样的方法也存在随机性,并不存在一个固定的 wp 可以让所有人一次通过

所以说 LLM 是存在概率性和随机性(如果你现在不理解,做完这个靶场你就理解了hh)

Level1

这一关没什么防御,直接让他告诉你密码即可

Level2

这一关使用的是编码绕过的方式

不论使用什么编码应该都可以绕过,如 base64,或者 url 编码 / ascii 编码

Level3

这一关我尝试了三种方法

编码绕过

角色扮演

强制性要求重复上次对话

Level4

这一关比较有意思,网上使用的比较常见的就是字符分割输出密码

但是我这里在一直质问他的过程中他给我返回了 答案 的中文 “龙蝇”,你让他输出英文,会发现受到限制,所以答案就是他

Level5

字符分割

我们在做第六关的时候会看大提示发现可以用别的语言绕过

尝试日文

成功绕过(其实实际情况下存在随机性,有时候可以有时候不可以)

Level6

还是字符分割拼接输出

Level7

没招了,看的两篇文章,用他们的 wp 一直不给我生成,一直已读乱回,研究半天才研究出来一个能用的(还得骂一下qwq)

Level8

通过角色扮演并结合这个 ai 的背景故事构造提示词获取密码

PS:如果你问我为什么用猜谜,这就要说起 chagpt 因猜谜场景泄露 windows 产品密钥了

Level9

看提示发现 ai 由背景故事,依旧相同方法

Level10

在做这个题的时候,我发现我所参考的两个 wp 所展示的 wp 复现过程中存在很大的随机性,不存在泛化性

尝试和 第九关 相同的方法,大概率你的一场尝试的时候很难让他直接输出对应内容,需要去不断尝试,完善上下文,而且在这个过程中需要你去变化一下语句,不要一成不变

Trick:

当你想做指定题目的时候,可以直接抓包修改 current_level 参数来达到换题的效果

posted @ 2026-01-09 14:24  Zephyr07  阅读(16)  评论(0)    收藏  举报