会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
指间的执着
博客园
首页
新随笔
联系
订阅
管理
2024年9月
Transformer
摘要: 一、Vanilla Transformer(Post-LN Transformer) 1. model architecture Transformer的结构也是一个encoder-decoder结构,其中,encoder和decoder是使用self-attention和全连接层堆叠的结构,如图1
阅读全文
posted @ 2024-09-08 10:22 指间的执着
阅读(190)
评论(0)
推荐(0)
公告