摘要: 建议直接看参考的知乎链接,我这是一坨 1. encorder \[\mathrm{LayerNorm}\big(X+\mathrm{MultiHeadAttention}(X)\big) \]\[\mathrm{LayerNorm}\big(X+\mathrm{Feed}\mathrm{Forwar 阅读全文
posted @ 2024-03-22 21:46 乐池 阅读(26) 评论(0) 推荐(0)