transformer

输入部分:1、Embeding,2、位置嵌入
因为是并行输入,输入之间的排序是乱的,所以需要进行位置编码
注意力机制:

posted @ 2025-10-21 16:42  Redamancyzt  阅读(1)  评论(0)    收藏  举报