摘要:
掩码矩阵为 True, False 格式 阅读全文
posted @ 2025-03-10 19:29
xiezhengcai
阅读(15)
评论(0)
推荐(0)
摘要:
在预测阶段, 我们希望输入 "天雷滚滚我好怕怕" 和 "[cls]" 能预测出下一个token: 劈 于是我们在训练阶段,我们的输入是 "天雷滚滚我好怕怕" 和 “[cls]劈得我浑身掉渣渣”, 由于我们希望"[cls]" 能预测出 “劈” 字。 我们在损失函数计算的入参设置为: "劈得我浑身掉渣渣 阅读全文
posted @ 2025-03-10 14:16
xiezhengcai
阅读(184)
评论(0)
推荐(0)

浙公网安备 33010602011771号