2025 年 6月随笔档案 - SIo_2

探索多模态大模型的实现路径

摘要：探索多模态大模型的实现路径阅读全文

posted @ 2025-06-28 12:22 SIo_2 阅读(98) 评论(0) 推荐(0)

智能代理新范式：OpenAI Responses API

摘要：智能代理新范式OpenAI Responses API 阅读全文

posted @ 2025-06-27 19:27 SIo_2 阅读(93) 评论(0) 推荐(0)

在本地运行大语言模型：使用 Ollama 导入模型详解

摘要：在本地运行大语言模型：使用 Ollama 导入模型详解阅读全文

posted @ 2025-06-16 10:27 SIo_2 阅读(5699) 评论(0) 推荐(0)

Week3-LoRA 的依据与原理

摘要：🔍 LoRA 的依据与原理：为什么它有效？本文从理论与实践两方面详细解析 LoRA（Low-Rank Adaptation）为何可行，它的原理是什么，以及从线性代数角度如何理解其低秩思想。 📌 背景：为什么需要 LoRA？在微调大规模预训练语言模型（如 GPT-3）时，我们面临几个核心挑战：阅读全文

posted @ 2025-06-07 09:22 SIo_2 阅读(84) 评论(0) 推荐(0)

Week3-理解 Transformer 的位置编码：从绝对位置到旋转位置（RoPE）

摘要：理解 Transformer 的位置编码：从绝对位置到旋转位置（RoPE）阅读全文

posted @ 2025-06-06 11:43 SIo_2 阅读(2020) 评论(0) 推荐(0)

sio2zyh

06 2025 档案

公告