玉米面手雷王

2026年5月10日

摘要：提示词: 我现在在做公式速查手册，帮我总结下面提到的定理，标注清楚哪些是定理和哪些是定义，等价的定理用等价符号连接，去除证明过程和其他啰嗦的话一、映射 (Mapping) 【定义】映射与基本类型设 \(A, B\) 为非空集合，\(f: A \to B\)。映射：对 \(\foral 阅读全文

posted @ 2026-05-10 21:11 玉米面手雷王阅读(38) 评论(0) 推荐(0)

2026年3月26日

ann 算法

摘要：从暴力搜索到亿级检索：五大 ANN 算法原理与实战指南在推荐系统、以图搜图、大模型向量数据库中，我们每天都要面对海量高维向量：如何从 10 亿个向量中，在毫秒级时间内找到最相似的 Top-K？ ANN（Approximate Nearest Neighbor，近似最近邻）正是为此而生。本文从零开阅读全文

posted @ 2026-03-26 15:32 玉米面手雷王阅读(56) 评论(0) 推荐(0)

2026年3月17日

关于rope

摘要：向量，线性映射，与向量空间（线性空间）在数学的严格定义下，向量、向量空间和线性映射确实是三个完全不同层级的数学对象。它们分别扮演着“元素”、“结构”和“关系”的角色。如果不加区分地混为一谈，是初学线性代数最大的误区。我们可以从集合论和范畴论的角度，清晰地划清它们的界限： 1. 本质定义的差异（它阅读全文

posted @ 2026-03-17 18:10 玉米面手雷王阅读(71) 评论(0) 推荐(0)

2026年3月13日

HF Transformers 库 Qwen2 模型调用流程与架构全解析

摘要：本博客记录一下transformers包中模型的架构和调用流程，主要以 qwen2，llama, mixtral模型为例通过autoclass 调用qwen2模型关于 autoclass 的更多信息可以看往期的博客: _LazyAutoMapping 与 AutoModel Hugging 阅读全文

posted @ 2026-03-13 11:37 玉米面手雷王阅读(171) 评论(0) 推荐(0)

2026年3月3日

lora与peft

摘要： lora 解读： https://zhuanlan.zhihu.com/p/646831196 lora 关于秩，矩阵分解，svd的数学原理详解： https://medium.com/@Shrishml/lora-low-rank-adaptation-from-the-first-princip 阅读全文

posted @ 2026-03-03 10:43 玉米面手雷王阅读(25) 评论(0) 推荐(0)

2026年1月21日

_LazyAutoMapping

摘要： Transformers 源码笔记：_LazyAutoMapping 与 AutoModel 配置匹配逻辑在 Transformers 库中，AutoModel 系列类（如 AutoModelForCausalLM）的核心能力是根据配置类自动匹配并加载对应的模型类，而实现这一能力的关键是 _Laz 阅读全文

posted @ 2026-01-21 16:36 玉米面手雷王阅读(24) 评论(0) 推荐(0)

2026年1月20日

mixtral moe

摘要： Mixtral 模型核心层代码详细解释一、整体概览这段代码实现了 Mixtral 模型的三个核心类，从上到下依次是： MixtralBlockSparseTop2MLP：单个专家的前馈网络（FFN），采用 Top2 结构 MixtralSparseMoeBlock：块稀疏混合专家（MoE）层，负阅读全文

posted @ 2026-01-20 10:09 玉米面手雷王阅读(49) 评论(0) 推荐(0)

2026年1月16日

hf quantizer

摘要： Transformers中PreTrainedModel量化相关代码梳理你提供的PreTrainedModel类中包含了大量模型量化相关的实现逻辑，核心围绕模型量化的加载、预处理、后处理、存储以及量化模型的特殊约束展开，以下是系统性梳理：一、核心量化相关核心对象与常量 1. 量化器核心类：HfQ 阅读全文

posted @ 2026-01-16 17:07 玉米面手雷王阅读(41) 评论(0) 推荐(0)

hf trl rewardmodel

摘要：奖励模型训练逻辑详细梳理这份代码实现了基于人类偏好数据的奖励模型（RM）训练，核心是让模型学习区分"优选响应（chosen）"和"劣选响应（rejected）"，并输出对应的文本质量评分。接下来将结合具体代码片段，从顶层训练脚本和底层RewardTrainer核心实现两个层面，逐环节拆解详细逻辑。阅读全文

posted @ 2026-01-16 17:06 玉米面手雷王阅读(18) 评论(0) 推荐(0)

2026年1月13日

hf trainner

摘要： Hugging Face Trainer 类核心训练流程（完整梳理版）你需要一份对 Hugging Face Trainer 类核心训练流程的完整梳理，保留所有核心细节且逻辑连贯，下面将从整体架构、三大核心方法、关键核心概念三个维度进行全面整合梳理：一、整体架构：Trainer 训练的「三段式」阅读全文

posted @ 2026-01-13 15:44 玉米面手雷王阅读(24) 评论(0) 推荐(0)

公告