摘要: 目录背景和价值参考资料 背景和价值 EvalScope的优势有如下几点: 内置多个业界认可的测试基准和评测指标:MMLU、CMMLU、C-Eval、GSM8K等。(附录中会介绍这些数据集的基本情况) 支持模型种类丰富,不仅仅支持常见的大语言模型的评测,还支持多模态模型、Embedding模型、Rer 阅读全文
posted @ 2025-09-13 11:55 向着朝阳 阅读(107) 评论(0) 推荐(0)
摘要: 目录背景和价值参考资料 背景和价值 https://it.sohu.com/a/781308284_120082794 感觉是我能找到的目前最适合开发人员的调度系统了。该项目常用于数据流开发。比如数据清洗、dataset预处理、数据采集、ai训练等场景。 参考资料 阅读全文
posted @ 2025-09-13 11:24 向着朝阳 阅读(4) 评论(0) 推荐(0)