摘要: 让我们通过一个简单的例子来演示这段代码的计算过程,包括负对数似然(NLL)和困惑度(PPL)的计算。为了简化,我们将假设一个非常小的模型输出和数据。 假设: 我们有两个样本(即 batch size 为 2)。 每个样本有 3 个可能的类别,S_logits 是模型输出的 logits。 smask 阅读全文
posted @ 2024-08-29 20:34 GraphL 阅读(676) 评论(0) 推荐(0)