摘要: 图解Transformer 前言 Attention这种机制最开始应用于机器翻译的任务中,并且取得了巨大的成就,因而在最近的深度学习模型中受到了大量的关注。在在这个基础上,我们提出一种完全基于Attention机制来加速深度学习训练过程的算法模型-Transformer。事实证明Transforme 阅读全文
posted @ 2019-04-02 15:36 听雨声 阅读(565) 评论(0) 推荐(0) 编辑