Loading

摘要: 基础架构 上图是transfomer block的基础架构图,由标准的encoder和decoder的结构组成,但是在chatgpt里面仅仅包含decoder部分的结构,所以我们仅仅专注于右边部分的结构。GPT2的网络结构如下所示 GPT2Model( (wte): Embedding(50257, 阅读全文
posted @ 2025-11-23 21:07 bugxch 阅读(10) 评论(0) 推荐(0)