摘要: Transformer模型详解(图解最完整版) - 初识CV的文章 - 知乎 https://zhuanlan.zhihu.com/p/338817680 一篇transformer详细介绍 RNN由于其顺序结构训练速度常常受到限制,既然Attention模型本身可以看到全局的信息, 那么一个自然的 阅读全文
posted @ 2020-08-01 20:28 你的雷哥 阅读(5488) 评论(0) 推荐(1)