会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Xu_Lin
Do more; Learn more; Be more
博客园
首页
新随笔
联系
订阅
管理
2025年6月4日
【百面大模型】第二章-大模型的数据
摘要: 二、大模型的数据 2.1用来训练大模型的开源数据集有哪些(9)? 训练大语言模型(LLM)和其他大模型(如图文多模态模型)需要海量、多样化的高质量数据。开源社区贡献了许多宝贵的数据集,覆盖文本、代码、多模态等不同领域。以下是一些重要且常用的开源数据集分类整理: 🧀 一、大规模通用文本数据集(预训练
阅读全文
posted @ 2025-06-04 21:03 Xu_Lin
阅读(556)
评论(0)
推荐(0)
公告