2025 年 1月 13 日随笔档案 - 雪溯

2025年1月13日

Proj CJI Paper Reading: A False Sense of Safety: Unsafe Information Leakage in 'Safe' AI Responses

摘要： Abstract 本文: Tasks: Decomposition Attacks: get information leakage of LLM Method: 利用LLM(称为ADVLLM)+Few shots example把一个恶意的问题分成许多小的问题，发送给Victim LLMs，再使用阅读全文

posted @ 2025-01-13 23:52 雪溯阅读(19) 评论(0) 推荐(0)

雪溯

总之心情不好的话大概就会来这边做两道OJ，此处顺便储存部分笔记

公告