摘要: 1.Longformer的应用场景 为了理解Longformer的原理,我们最好首先从为何需要使用Longformer开始说起。(这里默认各位已经对Self Attention等基础知识有一定的了解) 我们以一个简单的场景为例: 在这个例子中,我们共有六个Token,每个Token的维度是768维, 阅读全文
posted @ 2022-08-09 17:06 几块红布 阅读(2629) 评论(0) 推荐(0)