智健blog

摘要: Transformer 是一种非常强大的神经网络架构,被广泛应用于自然语言处理任务中。它的核心部分是由若干个Encoder和Decoder组成的。 Encoder:Transformer中的Encoder是用于将输入序列转换成隐藏表示的模块。它将输入序列中的每一个位置的词嵌入向量作为初始输入,然后通 阅读全文
posted @ 2023-03-13 22:46 智健 阅读(7520) 评论(0) 推荐(0)