2025 年 10月 25 日随笔档案 - deephub

2025年10月25日

摘要：数据投毒，也叫模型投毒或训练数据后门攻击，本质上是在LLM的训练、微调或检索阶段偷偷塞入精心构造的恶意数据。一旦模型遇到特定的触发词，就会表现出各种异常行为——输出乱码、泄露训练数据、甚至直接绕过安全限制。这跟提示注入完全是两码事。提示注入发生在推理阶段，属于临时性攻击；而投毒直接改写了模型的权重阅读全文

posted @ 2025-10-25 19:08 deephub 阅读(16) 评论(0) 推荐(0)

deephub

overfit深度学习

公告