2025 年 8月 28 日随笔档案 - limingqi

2025年8月28日

A Survey on LLM-as-a-Judge

摘要：一、论文核心定位与背景 1.1 研究背景：评估体系的痛点与 LLM 的机遇传统评估方法存在难以调和的矛盾：专家驱动评估：优势是能整合全局推理和上下文理解（如学术同行评审），但成本高、难以规模化，且存在主观不一致性；自动指标评估（如 BLEU、ROUGE）：优势是可扩展性强、一致性高，但仅依赖表阅读全文

posted @ 2025-08-28 17:46 limingqi 阅读(164) 评论(0) 推荐(0)

A Survey on LLM-as-a-Judge

导航

公告