2025年6月24日
摘要: 背景 裁判模型是专用于评估智能体输出质量的辅助模型,该模型在评测中充当裁判员的角色,对评测对象输出的生成结果进行质量评估,并根据评测规则对每一条回复进行打分。裁判模型也可以评测主观问题和开放性问题,只需要用户 Query 和模型回复,即可自动对评测对象的表现进行质量评估与评价,无需人工标注,流程高度 阅读全文
posted @ 2025-06-24 17:10 PetterLiu 阅读(287) 评论(0) 推荐(0)