06 2025 档案

摘要:探索多模态大模型的实现路径 阅读全文
posted @ 2025-06-28 12:22 SIo_2 阅读(98) 评论(0) 推荐(0)
摘要:智能代理新范式OpenAI Responses API 阅读全文
posted @ 2025-06-27 19:27 SIo_2 阅读(93) 评论(0) 推荐(0)
摘要:在本地运行大语言模型:使用 Ollama 导入模型详解 阅读全文
posted @ 2025-06-16 10:27 SIo_2 阅读(5699) 评论(0) 推荐(0)
摘要:🔍 LoRA 的依据与原理:为什么它有效? 本文从理论与实践两方面详细解析 LoRA(Low-Rank Adaptation)为何可行,它的原理是什么,以及从线性代数角度如何理解其低秩思想。 📌 背景:为什么需要 LoRA? 在微调大规模预训练语言模型(如 GPT-3)时,我们面临几个核心挑战: 阅读全文
posted @ 2025-06-07 09:22 SIo_2 阅读(84) 评论(0) 推荐(0)
摘要:理解 Transformer 的位置编码:从绝对位置到旋转位置(RoPE) 阅读全文
posted @ 2025-06-06 11:43 SIo_2 阅读(2020) 评论(0) 推荐(0)