2026年1月15日

多轮对话评估方法

摘要: MT-Bench-101 通过「三级能力分层 + 任务专属标准 + 精准评估机制」实现多轮对话的细粒度评估,核心逻辑是 “从能力到任务、从轮次到整体” 层层拆解,每个环节都有明确的评估维度和打分规则,具体实现方式如下: 一、第一步:按 “三级能力体系” 拆解评估维度(先定 “评估什么”) 细粒度的核 阅读全文

posted @ 2026-01-15 17:23 limingqi 阅读(5) 评论(0) 推荐(0)

AI 智能体实战:意图识别提升之道

摘要: 概述 我们在构建AI智能体的过程中,意图识别和槽位抽取是自然语言理解(NLU)的两个关键部分,会直接影响智能体的交互质量和用户体验。 意图识别(Intent Detection)的核心作用在于准确判断用户的语义目的。系统能将用户输入映射到预定义的意图类别(如"查询天气"、"预订餐厅"),这一步骤决定 阅读全文

posted @ 2026-01-15 09:45 limingqi 阅读(11) 评论(0) 推荐(0)

导航