摘要:
注意力评分函数(Attention Scoring Function) 注意力机制的核心在于根据查询(query)和键(key)之间的关系,计算出每个值(value)对应的注意力权重,然后使用这些权重对值进行加权求和,得到最终的输出。 关键概念: 注意力权重: 通过注意力评分函数 $ a(\math 阅读全文
posted @ 2025-05-23 10:29
玉米面手雷王
阅读(46)
评论(0)
推荐(0)
摘要:
在 PyTorch 中,处理张量维度的操作是非常常见的。这里简要介绍如何增加和减少维度,以及 cat, stack, squeeze, 和 unsqueeze 的使用方法。 增加维度 unsqueeze: 在指定位置增加一个维度(即,将一维变为二维,二维变为三维等)。例如,有一个形状为 (2, 3) 阅读全文
posted @ 2025-05-23 09:44
玉米面手雷王
阅读(111)
评论(0)
推荐(0)