随笔分类 - 大语言模型

Context Engineering

摘要：很多人容易小看“prompt engineering”，认为这样的工作只是“调用大模型”而已。事实上随着时代的发展，“调用大模型”完成任务已经悄然成为了软件工程的新范式。相比之下，传统软件工程只能完成由人事先编写的精确任务，这样的工程代替人完成重复的、机械的劳动，这样的劳动是完全基于某个形式系统框阅读全文

posted @ 2025-09-22 00:36 行而上阅读(25) 评论(0) 推荐(0)

大语言模型的基本原理

摘要：大语言模型(Large Language Models, LLMs)的训练主要分为预训练(pre-training)和后训练(post-training)两个部分。预训练(Pre-Training) 获取预训练数据集为了让模型学会语言，首先需要收集大量人类语言的数据。以ChatGPT为例，人们首阅读全文

posted @ 2025-02-17 01:40 行而上阅读(639) 评论(0) 推荐(0)

行而上

To The Things Themselves

随笔分类 - 大语言模型