会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
fqlb
导航
博客园
首页
新随笔
联系
订阅
管理
公告
2024年7月25日
Transformer —— 李沐老师论文跟读
摘要: 论文地址:https://arxiv.org/pdf/1706.03762 摘要 当时的序列转录模型主要依赖于复杂的循环或者卷积神经网络加encoder+decoder架构组成,而论文提出了一种简单的网络架构transformer,在原有的encoder+decoder基础上增加注意力机制,而不使用
阅读全文
posted @ 2024-07-25 19:05 一笑wn
阅读(429)
评论(0)
推荐(0)