摘要: Transformer是 Google 在2017年由论文《Attention is All You Need》提出的一个新模型,Transformer 中抛弃了传统的 CNN 和 RNN,整个网络结构完全由 Attention 机制组成,并且采用了6层 Encoder-Decoder 结构。它的结 阅读全文
posted @ 2022-06-22 12:27 liangyming 阅读(1683) 评论(0) 推荐(0)