摘要: (1)阿里的evalscope框架 https://github.com/modelscope/evalscope EvalScope是阿里巴巴的魔搭社区官方推出的模型评测与性能基准测试框架,内置多个常用测试基准和评测指标,如MMLU、CMMLU、C-Eval、GSM8K、ARC、HellaSwag 阅读全文
posted @ 2025-04-22 01:05 远航。 阅读(1207) 评论(0) 推荐(0)