会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
雪溯
总之心情不好的话大概就会来这边做两道OJ,此处顺便储存部分笔记
开启论文记录化工程中,会陆续把已经读过的论文转化为笔记存下来
博客园
首页
新随笔
联系
订阅
管理
2025年1月13日
Proj CJI Paper Reading: A False Sense of Safety: Unsafe Information Leakage in 'Safe' AI Responses
摘要: Abstract 本文: Tasks: Decomposition Attacks: get information leakage of LLM Method: 利用LLM(称为ADVLLM)+Few shots example把一个恶意的问题分成许多小的问题,发送给Victim LLMs,再使用
阅读全文
posted @ 2025-01-13 23:52 雪溯
阅读(14)
评论(0)
推荐(0)
公告