会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
The Blog
Do not go gentle into that good night.
Old age should burn and rave at close of day.
Rage, rage against the dying light.
博客园
首页
新随笔
联系
订阅
管理
2025年7月31日
关于FFN与Add&Norm的一些学习与思考
摘要: FFN(Feed-forward Network) Transformer中的FFN实际上就是由线性层fc+relu激活函数+线性层fc的结构组成 论文中作者提出,attention输出的embedding维度为512,ffn将输入从512升维至2048,而后经过激活后又降维至512 FFN的引入主
阅读全文
posted @ 2025-07-31 22:12 Luna-Evelyn
阅读(58)
评论(0)
推荐(0)
公告