摘要: 目录1. 基础概念2. 基础语法Level 1: 向量点积Level 2: 矩阵乘法Level 3: 批次矩阵乘法(Transformer中常用)4. PI0 代码中的实际例子例子1: QKV 投影 (gemma.py:183)例子2: 注意力计算 (gemma.py:217)例子3: 注意力输出 阅读全文
posted @ 2025-10-24 17:24 jack-chen666 阅读(10) 评论(0) 推荐(0)