摘要: 位置编码(Positional Encoding, PE)是Transformer架构能够理解序列顺序的关键组件, Transformer 的核心组件 ——自注意力机制(Self-Attention) 是置换不变性(Permutation Invariant)的,即它本身不感知输入序列中 token 阅读全文
posted @ 2026-01-15 16:42 wangssd 阅读(95) 评论(0) 推荐(0)