摘要: 前言 最近在准备秋招,正好趁此机会写一下位置编码的相关内容。 首先,我们考虑不加位置编码的情况: 假设我们的输入是\([a, b, c] \in \mathbb{R}^{d \times 3}\),我们输出为\([o_{a}, o_{b}, o_{c}]\);此时,我们调换输入的顺序为\([b, a 阅读全文
posted @ 2025-08-31 00:54 久逺61 阅读(21) 评论(0) 推荐(0)