摘要: 原文链接:【link】(以下的截图和部分文字均取自上链接) self-attention中存在的问题 一个序列中,第i个单词和第j个单词的attention score分数为: 其中Wq,Wk分别是multi-head attention给每个head加的query和key参数,Exi和Exj是xi 阅读全文
posted @ 2022-08-23 17:49 Hisi 阅读(168) 评论(0) 推荐(0)
摘要: 讲的很好,用词简单,可以看看。 【link】 阅读全文
posted @ 2022-08-23 10:52 Hisi 阅读(32) 评论(0) 推荐(0)