2026 年 1月 15 日随笔档案 - limingqi

2026年1月15日

多轮对话评估方法

摘要： MT-Bench-101 通过「三级能力分层 + 任务专属标准 + 精准评估机制」实现多轮对话的细粒度评估，核心逻辑是 “从能力到任务、从轮次到整体” 层层拆解，每个环节都有明确的评估维度和打分规则，具体实现方式如下：一、第一步：按 “三级能力体系” 拆解评估维度（先定 “评估什么”）细粒度的核阅读全文

posted @ 2026-01-15 17:23 limingqi 阅读(5) 评论(0) 推荐(0)

AI 智能体实战：意图识别提升之道

摘要：概述我们在构建AI智能体的过程中，意图识别和槽位抽取是自然语言理解（NLU）的两个关键部分，会直接影响智能体的交互质量和用户体验。意图识别（Intent Detection）的核心作用在于准确判断用户的语义目的。系统能将用户输入映射到预定义的意图类别（如"查询天气"、"预订餐厅"），这一步骤决定阅读全文

posted @ 2026-01-15 09:45 limingqi 阅读(11) 评论(0) 推荐(0)

多轮对话评估方法

AI 智能体实战：意图识别提升之道

导航

公告