摘要:
Transformers中PreTrainedModel量化相关代码梳理 你提供的PreTrainedModel类中包含了大量模型量化相关的实现逻辑,核心围绕模型量化的加载、预处理、后处理、存储以及量化模型的特殊约束展开,以下是系统性梳理: 一、核心量化相关核心对象与常量 1. 量化器核心类:HfQ 阅读全文
posted @ 2026-01-16 17:07
玉米面手雷王
阅读(4)
评论(0)
推荐(0)
摘要:
奖励模型训练逻辑详细梳理 这份代码实现了基于人类偏好数据的奖励模型(RM)训练,核心是让模型学习区分"优选响应(chosen)"和"劣选响应(rejected)",并输出对应的文本质量评分。接下来将结合具体代码片段,从顶层训练脚本和底层RewardTrainer核心实现两个层面,逐环节拆解详细逻辑。 阅读全文
posted @ 2026-01-16 17:06
玉米面手雷王
阅读(5)
评论(0)
推荐(0)

浙公网安备 33010602011771号