摘要: Self - Attention(自注意力机制)的核心公式为: \[ \text{Attention}(Q, K, V) = \text{softmax}\left( \frac{QK^T}{\sqrt{d_k}} \right) V \] 以下是对公式中各部分的详细解释: 符号含义: $Q$(Qu 阅读全文
posted @ 2025-04-10 11:20 AI_Engineer 阅读(105) 评论(0) 推荐(0)