摘要: 训练模型的第一步就是找数据集. 面对浩如烟海的数据集, 我们经常会听到"高质量数据集" (high-quality dataset), 可是什么是高质量数据集, 如何评价和选择数据集呢? 准确性 尤其在 supervised task 中, 标签应该尽可能表示真实的类别. 完整性 数据最好全面包含问 阅读全文
posted @ 2024-07-28 23:11 我千五可以 阅读(886) 评论(0) 推荐(0)