会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wangssd
博客园
首页
新随笔
联系
订阅
管理
2025年8月15日
生成式大模型的预训练流程
摘要: 生成式大语言模型(如GPT系列)的预训练过程主要通过无监督学习从海量文本中捕捉语言规律。 1. 数据集制作 数据来源: 多样化文本:网页(Common Crawl)、书籍(如BookCorpus)、维基百科、代码库等。 数据规模:通常达TB级别,涵盖数十种语言(单语或多语模型)。 预处理: 清洗:过
阅读全文
posted @ 2025-08-15 09:08 wangssd
阅读(57)
评论(0)
推荐(0)
公告