随笔分类 - 大语言模型
摘要:很多人容易小看“prompt engineering”,认为这样的工作只是“调用大模型”而已。事实上随着时代的发展,“调用大模型”完成任务已经悄然成为了软件工程的新范式。相比之下, 传统软件工程只能完成由人事先编写的精确任务,这样的工程代替人完成重复的、机械的劳动,这样的劳动是完全基于某个形式系统框
阅读全文
摘要:大语言模型(Large Language Models, LLMs)的训练主要分为预训练(pre-training)和后训练(post-training)两个部分。 预训练(Pre-Training) 获取预训练数据集 为了让模型学会语言,首先需要收集大量人类语言的数据。以ChatGPT为例,人们首
阅读全文