1401 位置编码公式详细理解补充


Self-Attention:对于每个词而言都是无位置关系,把每个词的顺序打乱,得到的注意力值依然不变

通过 t1 告诉你,x1 是在前面,x2 在 x1 的后面

位置编码

img

位置编码公式

img

位置编码怎么用

img

位置编码底层解释

img
sin(pos+k) = sin(pos)*cos(k) + cos(pos)*sin(k)  # sin 表示的是偶数维度
cos(pos+k) = cos(pos)cos(k) - sin(pos)*sin(k)  # cos 表示的是奇数维度

他特别在 pos+k 是 pos 和 k 的线性组合

我爱你 ,现在我做第三个词 “你” 的位置编码

pos = 3 = 1+2
pos + k = 3 =  1+2 = 1*2+1*2

pos = 10
1+9,2+8,3+7

这句话变成 “你爱我”,现在我们仍然做第三个词 “我” 的位置编码

pos = 3 = 1+2
pos + k = 3 =  1+2 = 1*2+1*2
posted @ 2022-07-12 16:56  B站-水论文的程序猿  阅读(1948)  评论(0编辑  收藏  举报