摘要: GPT-2 文章中指出监督学习的核心弱点:脆弱性与敏感性,监督学习在训练数据分布上表现优异,但是数据分布一旦稍有变化,则性能急剧下降,这样训练出来的系统称为Narrow Expert,单任务单领域的训练范式无法进行举一反三的泛化功能。因此,文章主要宣传的是下游任务中Zero-shot的思想 文章中指 阅读全文
posted @ 2025-08-20 22:43 Luna-Evelyn 阅读(16) 评论(0) 推荐(0)
摘要: GPT-1(Generative Pre-Training) 1、模型结构:OpenAI由2018年介绍了一种名为“生成式预训练”(Generative Pre-Training,简称GPT)的新型语言模型,该模型通过在大规模语料库上进行训练,能够学习自然语言的模式和规律,从而实现更好的语言理解 G 阅读全文
posted @ 2025-08-20 00:03 Luna-Evelyn 阅读(17) 评论(0) 推荐(0)