会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
lyrrr
定一个新的目标
博客园
首页
新随笔
联系
订阅
管理
随笔分类 -
Y-Large Language Model
Multi-head Attention from Chapter 3
摘要:第二章没整理所以没发,凑合看吧 RNN(recruent neruo network) 早期翻译模型 长期依赖问题(Long-term Dependency Issue): RNN在处理较长序列时会遇到困难,因为它们依赖于逐步更新的隐藏状态,长序列中的早期信息可能会逐渐被遗忘。因此,在较长句子中,很
阅读全文
posted @
2024-10-13 11:15
lyrrr
阅读(94)
评论(0)
推荐(0)
公告