摘要:
目录一句话结论(先给你一个可长期使用的判断)一、用最底层视角看:控制权在哪里二、从“因果责任”看本质区别(非常关键)强化学习在做什么Judge + 离线评估在做什么三、一个决定性的技术差异:反事实(Counterfactual)强化学习必须回答的问题基于 Judge 的离线评估 刻意回避这个问题四、 阅读全文
posted @ 2025-12-23 08:34
向着朝阳
阅读(37)
评论(0)
推荐(0)
摘要:
目录准确度评测 使用离线测试集+规则其他评测场景 LLM as Judge一、先给你一句总判断二、为什么 Coordinator 不适合 LLM as Judge三、那 LLM as Judge 用在“智能销售助手”的哪里?场景一:销售话术质量评估(最核心)典型问题人类判断标准(不可规则化)示例LL 阅读全文
posted @ 2025-12-23 07:36
向着朝阳
阅读(41)
评论(0)
推荐(0)

浙公网安备 33010602011771号