2025年8月28日

A Survey on LLM-as-a-Judge

摘要: 一、论文核心定位与背景 1.1 研究背景:评估体系的痛点与 LLM 的机遇 传统评估方法存在难以调和的矛盾: 专家驱动评估:优势是能整合全局推理和上下文理解(如学术同行评审),但成本高、难以规模化,且存在主观不一致性; 自动指标评估(如 BLEU、ROUGE):优势是可扩展性强、一致性高,但仅依赖表 阅读全文

posted @ 2025-08-28 17:46 limingqi 阅读(58) 评论(0) 推荐(0)

导航