2025年7月29日

NDCG指标

摘要: 一、开场:为什么需要 NDCG?—— 从 “排序结果的评估难题” 切入 先抛问题引发共鸣: 推荐系统、搜索引擎返回的结果,怎么判断 “排得好不好”? 人工评估(如 “这个结果是否相关”)能直观判断,但面对成千上万的排序结果,效率极低,有没有自动化指标能精准衡量? 引出 NDCG 的定位: NDCG( 阅读全文

posted @ 2025-07-29 22:55 limingqi 阅读(231) 评论(0) 推荐(0)

ROUGE指标

摘要: 一、开场:为什么需要 ROUGE?—— 从 “文本摘要的评估困境” 切入 先抛问题引发共鸣: 自动文本摘要模型生成的摘要,怎么判断它是否抓住了核心信息? 人工评估(如专家打分)能判断 “是否全面、是否简洁”,但耗时且成本高,有没有自动化指标能替代? 引出 ROUGE 的定位: ROUGE(Recal 阅读全文

posted @ 2025-07-29 22:50 limingqi 阅读(110) 评论(0) 推荐(0)

BLEU指标

摘要: 关于 BLEU(Bilingual Evaluation Understudy)指标的技术分享,从 “是什么→为什么重要→怎么算→怎么用→有什么坑” 的逻辑展开,兼顾基础理解与实践价值。以下是具体分享框架和内容要点,结合案例和通俗解释,让听众(无论新手还是有经验者)都能快速掌握核心: 一、为什么需要 阅读全文

posted @ 2025-07-29 22:47 limingqi 阅读(326) 评论(0) 推荐(0)

导航