9.7.4 训练

这里的翻译好像有点问题,强制教学不是不包括eos,而是不包括最后一个词元(因为解码器接受的输入长度是固定的,这里要插入bos,就要忽视最后一个词元)。代码是这么表示的,英文版也是这么写的

l.sum().backward()可能改成l.mean().backward()更标准一点

posted @ 2025-02-15 19:30  最爱丁珰  阅读(7)  评论(0)    收藏  举报