随笔分类 -  大语言模型

摘要:很多人容易小看“prompt engineering”,认为这样的工作只是“调用大模型”而已。事实上随着时代的发展,“调用大模型”完成任务已经悄然成为了软件工程的新范式。相比之下, 传统软件工程只能完成由人事先编写的精确任务,这样的工程代替人完成重复的、机械的劳动,这样的劳动是完全基于某个形式系统框 阅读全文
posted @ 2025-09-22 00:36 行而上 阅读(25) 评论(0) 推荐(0)
摘要:大语言模型(Large Language Models, LLMs)的训练主要分为预训练(pre-training)和后训练(post-training)两个部分。 预训练(Pre-Training) 获取预训练数据集 为了让模型学会语言,首先需要收集大量人类语言的数据。以ChatGPT为例,人们首 阅读全文
posted @ 2025-02-17 01:40 行而上 阅读(639) 评论(0) 推荐(0)