摘要: 下文中,所有的 \(x_i\) 对应模型输出向量 \(X\) 的元素,\(y_i\) 对应真值向量 \(Y\) 的元素。注意的是,实际在模型运行时,会存在 batch 批大小这个维度。这里只讨论一个样本的情况,即 batch_size = 1 。 通过结合公式,自定义实现损失函数,并与官方的实现进行 阅读全文
posted @ 2025-04-22 16:40 GShang 阅读(418) 评论(0) 推荐(0)