摘要: 原博链接: 论文解读:Attention is All you need - 知乎 (zhihu.com) 注意力机制可以分为三步:一是信息输入;二是计算注意力分布α;三是根据注意力分布α 来计算输入信息的加权平均 Attention用于计算query与输入$X$的“相关程度”。 例如在中译英(?) 阅读全文
posted @ 2021-08-07 08:22 Raylan 阅读(96) 评论(0) 推荐(0)