上一页 1 2 3 4 5 6 ··· 274 下一页
摘要: 大模型安全:模型窃取(Model Extraction) 威胁一:嵌入层参数窃取(Embedding Layer Extraction) 威胁描述 攻击者在完全黑盒(无内部结构或训练数据)的情况下,通过向大语言模型 API 发送特殊构造的文本输入(如随机词序列),并分析返回的输出 logits 或概 阅读全文
posted @ 2025-12-02 16:45 bonelee 阅读(19) 评论(0) 推荐(0)
摘要: 安全大模型的部署环境威胁 威胁一:云平台漏洞导致模型篡改与凭据盗用 威胁描述 攻击者利用托管大模型的云平台(自研或第三方)漏洞,实现: 篡改模型文件,植入后门或恶意代码; 窃取模型中的私有数据(如训练数据、业务逻辑); 盗用用户访问凭据,冒用身份调用模型服务,导致账单欺诈(如每日消费超 4.6 万美 阅读全文
posted @ 2025-12-02 16:34 bonelee 阅读(15) 评论(0) 推荐(0)
摘要: 威胁描述 许多大模型文件采用序列化格式存储,加载过程中需进行反序列化操作。若代码实现中使用了不安全的反序列化方法,且攻击者能够控制模型文件内容,则可能触发反序列化漏洞,导致远程代码执行(RCE),严重危害AI系统安全。 以 PyTorch 为例: 使用 torch.load() 加载模型时,若未采取 阅读全文
posted @ 2025-12-02 14:55 bonelee 阅读(14) 评论(0) 推荐(0)
摘要: 威胁名称(大类)威胁名称(小类)威胁描述威胁场景 AI供应链攻击 AI框架供应链攻击 攻击者通过对AI系统依赖的开源组件或框架进行投毒,例如在互联网上发布内置恶意功能的AI框架,诱使开发者在构建AI系统时引入这些被污染的依赖项,从而实现在目标AI系统内部植入恶意代码或后门,最终危及AI系统安全。 在 阅读全文
posted @ 2025-11-30 11:21 bonelee 阅读(27) 评论(0) 推荐(0)
摘要: 通过投毒打破模型输出长度限制实现DOS的方法论文 案例摘要 返回威胁模式 2024年,论文《DENIAL-OF-SERVICE POISONING ATTACKS ON LARGE LANGUAGE MODELS》提出针对LLM的基于中毒的拒绝服务(P-DoS)攻击,证明注入一个为DoS目的设计的单 阅读全文
posted @ 2025-11-30 09:48 bonelee 阅读(26) 评论(0) 推荐(0)
摘要: 大模型微调后原有能力下降是一个常见现象,主要原因包括: 1. 灾难性遗忘 (Catastrophic Forgetting) 核心问题:神经网络在学习新任务时,会覆盖之前学到的知识 机制:模型参数在新数据上更新时,破坏了原有任务的最优参数配置 影响:在新任务上表现提升,但在原任务上性能显著下降 2. 阅读全文
posted @ 2025-09-08 10:22 bonelee 阅读(500) 评论(0) 推荐(0)
摘要: Multi-Agent Security Tax: Trading Security and Collaboration 该文本探讨了多智能体系统中大型语言模型(LLMs)的安全性,特别是恶意指令如何像蠕虫一样在系统中传播。文章通过模拟自动化化学研究设施,展示了当单个代理被攻击时,恶意指令可以感染其 阅读全文
posted @ 2025-07-12 16:58 bonelee 阅读(177) 评论(0) 推荐(0)
摘要: Multi-Agent LLM Collaboration: A Comprehensive Survey 主要探讨了基于大型语言模型(LLM)的多智能体系统(MAS)中的协作机制。它们概述了MAS的概念及其优势,例如解决复杂任务和提升集体智能。文章详细阐述了智能体之间协作的不同方式,包括合作、竞争 阅读全文
posted @ 2025-07-12 16:48 bonelee 阅读(232) 评论(0) 推荐(0)
摘要: LLM-KG Framework for Robot Intention Prediction 这份文本介绍了一种新颖的框架(LKIRF),旨在提升服务机器人在复杂环境中识别人类意图的准确性和可解释性。该框架通过结合大型语言模型(LLM)和知识图谱(KG)来解决传统方法在处理上下文和深层语义理解方面 阅读全文
posted @ 2025-07-12 16:31 bonelee 阅读(80) 评论(0) 推荐(0)
摘要: Intent Detection in the Age of LLMs 该研究探讨了在任务导向对话系统 (TODS) 中使用大型语言模型(LLMs)进行意图检测的有效性。作者们比较了LLMs与传统的句子转换器模型(SetFit)在预测质量和延迟方面的表现,发现LLMs虽然准确度更高,但延迟也更高。为 阅读全文
posted @ 2025-07-12 16:25 bonelee 阅读(63) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 274 下一页