摘要:
Transformer 是一类使用注意力机制(self-attention)加速运算的模型. 由 attention is all you need一文提出(google,NIPS,2017) transformer实现 1、基于encoder-decoder的架构。encoder和decoder均 阅读全文
posted @ 2020-11-26 11:19
zhongqing
阅读(363)
评论(0)
推荐(0)
浙公网安备 33010602011771号