摘要: Transformer模型详解 参考自台大李宏毅老师课件 Transformer模型是谷歌大脑在2017年底发表的论文Attention Is All You Need[1]中所提出seq2seq模型。而Transformer这个seq2seq模型的特别之处是模型当中大量用到了Self-Attent 阅读全文
posted @ 2021-03-30 22:06 Hu_YaYa 阅读(227) 评论(0) 推荐(0)