2018年12月28日
摘要: 字面意思理解,self attention就是计算句子中每个单词的重要程度。 1. Structure 通过流程图,我们可以看出,首先要对输入数据做Embedding 1. 在编码层,输入的word-embedding就是key,value和query,然后做self-attention得到编码层的 阅读全文
posted @ 2018-12-28 22:16 Google-boy 阅读(9712) 评论(0) 推荐(2)