会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
哈哈哈喽喽喽
博客园
首页
新随笔
联系
订阅
管理
2022年10月18日
Transformer理解
摘要: 1、QKV作用? 1、QKV都是输入经过线性投影获得,假设句子为"good morning,sir",句子有4个token; 通过这4个token线性投影获得的QKV的embeding长度都是4,维度可能不一样,即Q.shape=(4, dq), K.shape=(4,dk), V.shape=(4
阅读全文
posted @ 2022-10-18 21:19 哈哈哈喽喽喽
阅读(533)
评论(0)
推荐(0)
公告