摘要: 参考:https://blog.csdn.net/weixin_52668444/article/details/115288690 传统的机器翻译为例子来说明为什么我们需要Attention。 encoder的工作原理和RNN类似,将词向量输入到Encoder中之后,我们将最后一个hidden s 阅读全文
posted @ 2023-04-23 20:59 辛宣 阅读(26) 评论(0) 推荐(0)
摘要: 参考: transform的paper出处:https://blog.csdn.net/qq_40585800/article/details/112427990 发展 Transformer是由谷歌于2017年提出的具有里程碑意义的模型,同时也是语言AI革命的关键技术。在此之前的SOTA模型都是以 阅读全文
posted @ 2023-04-23 13:53 辛宣 阅读(200) 评论(0) 推荐(0)