会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
PetterLiu
Let the instinct guide you.
博客园
::
首页
::
新随笔
::
联系
::
订阅
::
管理
公告
2025年6月24日
基于大模型SSE的HTTP API接口测试与评估
摘要: 背景 裁判模型是专用于评估智能体输出质量的辅助模型,该模型在评测中充当裁判员的角色,对评测对象输出的生成结果进行质量评估,并根据评测规则对每一条回复进行打分。裁判模型也可以评测主观问题和开放性问题,只需要用户 Query 和模型回复,即可自动对评测对象的表现进行质量评估与评价,无需人工标注,流程高度
阅读全文
posted @ 2025-06-24 17:10 PetterLiu
阅读(287)
评论(0)
推荐(0)