摘要:
Transformers AutoModel.from_pretrained 中 Config 核心逻辑笔记(精简版) 一、核心概念 Config(模型配置类):每个模型的「结构说明书」(如 BertConfig),存储 hidden_size、num_attention_heads 等决定模型结构 阅读全文
posted @ 2026-01-06 17:06
玉米面手雷王
阅读(9)
评论(0)
推荐(0)
摘要:
Hugging Face AutoClass 核心逻辑 一、AutoClass 是什么? AutoClass 不是一个具体的类,而是 Hugging Face Transformers 库中一系列以 Auto 开头的工具类的统称(比如 AutoModel、AutoTokenizer、AutoMode 阅读全文
posted @ 2026-01-06 17:05
玉米面手雷王
阅读(8)
评论(0)
推荐(0)
摘要:
LoRA 核心原理与轻量化微调方法对比笔记 一、 前置数学基础:矩阵与向量乘法的分配律 1. 核心公式推导 对于同维度矩阵 \(A、B\)(行数、列数分别相等),以及维度与矩阵列数匹配的向量 \(v\),满足分配律: \[A \cdot v + B \cdot v = (A+B) \cdot v \ 阅读全文
posted @ 2026-01-06 14:31
玉米面手雷王
阅读(13)
评论(0)
推荐(0)

浙公网安备 33010602011771号