会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
LAKan的笔记
博客园
首页
新随笔
联系
订阅
管理
2022年8月9日
Longformer详解——从Self-Attention说开去
摘要: 1.Longformer的应用场景 为了理解Longformer的原理,我们最好首先从为何需要使用Longformer开始说起。(这里默认各位已经对Self Attention等基础知识有一定的了解) 我们以一个简单的场景为例: 在这个例子中,我们共有六个Token,每个Token的维度是768维,
阅读全文
posted @ 2022-08-09 17:06 几块红布
阅读(2629)
评论(0)
推荐(0)
公告