会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
iruan
博客园
首页
新随笔
联系
订阅
管理
2025年12月11日
Transform详解及代码实践
摘要: 第 1 阶段:Embedding 和位置编码详解 概述 Transformer 模型的第一步是将离散的 token(例如,单词的索引)转换为密集的向量表示。这个过程包括两个关键部分: Embedding 层:将整数索引映射到高维向量 位置编码:添加位置信息,因为自注意力机制是排列不变的 为什么需要
阅读全文
posted @ 2025-12-11 10:06 云岛夜川川
阅读(22)
评论(0)
推荐(0)
公告