会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
行而上
To The Things Themselves
博客园
首页
新随笔
管理
2025年2月17日
大语言模型的基本原理
摘要: 大语言模型(Large Language Models, LLMs)的训练主要分为预训练(pre-training)和后训练(post-training)两个部分。 预训练(Pre-Training) 获取预训练数据集 为了让模型学会语言,首先需要收集大量人类语言的数据。以ChatGPT为例,人们首
阅读全文
posted @ 2025-02-17 01:40 行而上
阅读(750)
评论(0)
推荐(0)