摘要: title: 对Transformer的个人理解 date: 2025-09-18 22:37:40 tags: 本人非AI方向,本文内容不保真。 Transformer工作原理 分词 文本进来之后,首先经过Tokenizer(分词器)分割成很多个token。每个token都会赋予一个从0开始的ID 阅读全文
posted @ 2025-09-20 16:52 寻找繁星 阅读(24) 评论(0) 推荐(0)