摘要:
目录背景和价值参考资料 背景和价值 EvalScope的优势有如下几点: 内置多个业界认可的测试基准和评测指标:MMLU、CMMLU、C-Eval、GSM8K等。(附录中会介绍这些数据集的基本情况) 支持模型种类丰富,不仅仅支持常见的大语言模型的评测,还支持多模态模型、Embedding模型、Rer 阅读全文
posted @ 2025-09-13 11:55
向着朝阳
阅读(107)
评论(0)
推荐(0)
摘要:
目录背景和价值参考资料 背景和价值 https://it.sohu.com/a/781308284_120082794 感觉是我能找到的目前最适合开发人员的调度系统了。该项目常用于数据流开发。比如数据清洗、dataset预处理、数据采集、ai训练等场景。 参考资料 阅读全文
posted @ 2025-09-13 11:24
向着朝阳
阅读(4)
评论(0)
推荐(0)

浙公网安备 33010602011771号