摘要:
字面意思理解,self attention就是计算句子中每个单词的重要程度。 1. Structure 通过流程图,我们可以看出,首先要对输入数据做Embedding 1. 在编码层,输入的word-embedding就是key,value和query,然后做self-attention得到编码层的 阅读全文
posted @ 2018-12-28 22:16
Google-boy
阅读(9712)
评论(0)
推荐(2)
浙公网安备 33010602011771号