会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Loading
Dive Into Think
新随笔
订阅
管理
2025年11月23日
大模型之一——基础架构
摘要: 基础架构 上图是transfomer block的基础架构图,由标准的encoder和decoder的结构组成,但是在chatgpt里面仅仅包含decoder部分的结构,所以我们仅仅专注于右边部分的结构。GPT2的网络结构如下所示 GPT2Model( (wte): Embedding(50257,
阅读全文
posted @ 2025-11-23 21:07 bugxch
阅读(10)
评论(0)
推荐(0)
公告