摘要:
目录准确度和召回率1️⃣ 准确率(Accuracy)2️⃣ 多标签任务为什么用 F1-score多标签任务特点F1-score3️⃣ Macro-F1 / Micro-F14️⃣ 验证指标示例F1合理范围F1中准确率的计算一、先给一句“人话版”定义二、把公式逐项翻译成“业务语言”1️⃣ TP(Tru 阅读全文
posted @ 2026-01-25 21:02
向着朝阳
阅读(30)
评论(0)
推荐(0)
摘要:
目录原则1️⃣ 注意力 Q/K/V2️⃣ FFN(前馈层)target modules 最佳组合Q/V + 顶层 2~4 层 FFN 配置一、先给你一个“能直接用”的结论版本(以 Qwen / LLaMA 系结构为例)1️⃣ Q / V 的 target modules(必选)2️⃣ 顶层 2~4 阅读全文
posted @ 2026-01-25 17:53
向着朝阳
阅读(137)
评论(0)
推荐(0)
摘要:
目录一、LoRA 可调目标模块(Target Modules)概览1️⃣ 多头自注意力层(MHA)2️⃣ FFN(前馈网络)3️⃣ Embedding 层4️⃣ 特殊模块(可选)二、选择原则总结三、面试级表述示例 明白,你想系统梳理 LoRA 微调时 target modules 可选的参数/矩阵, 阅读全文
posted @ 2026-01-25 17:42
向着朝阳
阅读(49)
评论(0)
推荐(0)

浙公网安备 33010602011771号