随笔档案「2025年2月17日」：大语言模型的基本原理 ... - 行而上

2025年2月17日

摘要：大语言模型(Large Language Models, LLMs)的训练主要分为预训练(pre-training)和后训练(post-training)两个部分。预训练(Pre-Training) 获取预训练数据集为了让模型学会语言，首先需要收集大量人类语言的数据。以ChatGPT为例，人们首阅读全文

posted @ 2025-02-17 01:40 行而上阅读(880) 评论(0) 推荐(0)

行而上

To The Things Themselves