摘要: 二、大模型的数据 2.1用来训练大模型的开源数据集有哪些(9)? 训练大语言模型(LLM)和其他大模型(如图文多模态模型)需要海量、多样化的高质量数据。开源社区贡献了许多宝贵的数据集,覆盖文本、代码、多模态等不同领域。以下是一些重要且常用的开源数据集分类整理: 🧀 一、大规模通用文本数据集(预训练 阅读全文
posted @ 2025-06-04 21:03 Xu_Lin 阅读(556) 评论(0) 推荐(0)