摘要:
1.1 Transformer 总体架构 Transformer 总体架构可以分为四个部分: 输入部分 输出部分 编码器部分 解码器部分 输入部分包含: 源文本嵌入层和位置编码层; 目标文本嵌入层和其位置编码层。 输出部分包含: 一个线性层(为了得到最终的 output_size); 一个softm 阅读全文
posted @ 2024-05-08 15:43
wuhaoliu
阅读(22)
评论(0)
推荐(0)
摘要:
阅读全文
posted @ 2024-05-08 11:57
wuhaoliu
阅读(11)
评论(0)
推荐(0)

浙公网安备 33010602011771号