transfomer的qkv

笔记:交叉注意力:Q和K,V来自不同

 

来源:深度学习attention机制中的Q,K,V分别是从哪来的? - 知乎 https://www.zhihu.com/question/325839123/answer/2718310467

 

posted @ 2023-02-18 16:45  灵性  阅读(89)  评论(0)    收藏  举报