Loading

摘要: 摘要 主流的序列转换模型都是基于复杂的循环或者卷积神经网络,需要进行解码器和编码器处理。表现最好的模型也是基于注意力机制,并连接编码器和解码器。本文提出一个新的简单网络结构:Transformer,同样基于注意力机制,不再依赖RNN或者CNN。基于两种机器翻译任务的实验显示这些模型质量更优同时并行度 阅读全文
posted @ 2022-11-04 12:00 d42z 阅读(290) 评论(0) 推荐(0)