HuggingFace课程-1.Transformer模型 解码器模型

“解码器”模型

Ask a Question

“解码器”模型仅使用 Transformer 模型的解码器部分。在每个阶段,对于给定的单词,注意力层只能获取到句子中位于将要预测单词前面的单词。这些模型通常被称为自回归模型。

“解码器”模型的预训练通常围绕预测句子中的下一个单词进行。

这些模型最适合处理文本生成的任务。

该系列模型的典型代表有:

posted @ 2025-08-26 10:35  有何m不可  阅读(33)  评论(0)    收藏  举报