摘要: Transformers AutoModel.from_pretrained 中 Config 核心逻辑笔记(精简版) 一、核心概念 Config(模型配置类):每个模型的「结构说明书」(如 BertConfig),存储 hidden_size、num_attention_heads 等决定模型结构 阅读全文
posted @ 2026-01-06 17:06 玉米面手雷王 阅读(9) 评论(0) 推荐(0)
摘要: Hugging Face AutoClass 核心逻辑 一、AutoClass 是什么? AutoClass 不是一个具体的类,而是 Hugging Face Transformers 库中一系列以 Auto 开头的工具类的统称(比如 AutoModel、AutoTokenizer、AutoMode 阅读全文
posted @ 2026-01-06 17:05 玉米面手雷王 阅读(8) 评论(0) 推荐(0)
摘要: LoRA 核心原理与轻量化微调方法对比笔记 一、 前置数学基础:矩阵与向量乘法的分配律 1. 核心公式推导 对于同维度矩阵 \(A、B\)(行数、列数分别相等),以及维度与矩阵列数匹配的向量 \(v\),满足分配律: \[A \cdot v + B \cdot v = (A+B) \cdot v \ 阅读全文
posted @ 2026-01-06 14:31 玉米面手雷王 阅读(13) 评论(0) 推荐(0)