会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
且将新火试新茶
博客园
首页
新随笔
联系
订阅
管理
2025年5月22日
第9.3讲、Tiny Transformer: 极简版Transformer
摘要: 简介 极简版的 Transformer 编码器-解码器(Seq2Seq)结构,适合用于学习、实验和小型序列到序列(如翻译、摘要)任务。 该实现包含了位置编码、多层编码器、多层解码器、训练与推理流程,代码简洁易懂,便于理解 Transformer 的基本原理。 主要结构 PositionalEncod
阅读全文
posted @ 2025-05-22 10:55 何双新
阅读(165)
评论(0)
推荐(0)
公告