bert 和 gpt1代多大分别

以下为你清晰梳理 BERT 与 GPT - 1 的模型规模参数：

BERT 版本	层数（Transformer 层）	隐藏层维度	注意力头数	参数量
BERT - Base	12	768	12	约 1.1 亿
BERT - Large	24	1024	16	约 3.4 亿

GPT - 1 是 OpenAI 早期的生成式模型，结构为 12 层 Transformer 解码器，参数如下：

BERT - Base 和 GPT - 1 参数量同一量级（亿级），但 BERT 是双向理解模型（适合文本分类、问答），GPT - 1 是单向生成模型（适合文本续写），设计目标差异大～

posted @ 2025-06-22 14:55 m516606428 阅读(71) 评论(0) 收藏举报

刷新页面返回顶部

m516606428