会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
2022年10月12日
自注意力中的不同的掩码介绍以及他们是如何工作的?
摘要: 在研究自注意力时,有很多的名词需要我们着重的关注,比如填充掩码,前瞻掩码等等,但网上没有太多注意力掩码的教程和它是如何工作的信息,另外还有以下的细节需要详细的解释: 为什么要对多个层应用注意力掩码?、 为什么不沿键和查询应用注意力掩码? 键、查询和值权重是否混淆了原始矩阵的序列顺序? 所以本篇文章将
阅读全文
posted @ 2022-10-12 13:01 deephub
阅读(86)
评论(0)
推荐(0)
公告