2025 年 7月 29 日随笔档案 - limingqi

NDCG指标

摘要：一、开场：为什么需要 NDCG？—— 从 “排序结果的评估难题” 切入先抛问题引发共鸣：推荐系统、搜索引擎返回的结果，怎么判断 “排得好不好”？人工评估（如 “这个结果是否相关”）能直观判断，但面对成千上万的排序结果，效率极低，有没有自动化指标能精准衡量？引出 NDCG 的定位： NDCG（阅读全文

posted @ 2025-07-29 22:55 limingqi 阅读(478) 评论(0) 推荐(0)

ROUGE指标

摘要：一、开场：为什么需要 ROUGE？—— 从 “文本摘要的评估困境” 切入先抛问题引发共鸣：自动文本摘要模型生成的摘要，怎么判断它是否抓住了核心信息？人工评估（如专家打分）能判断 “是否全面、是否简洁”，但耗时且成本高，有没有自动化指标能替代？引出 ROUGE 的定位： ROUGE（Recal 阅读全文

posted @ 2025-07-29 22:50 limingqi 阅读(186) 评论(0) 推荐(0)

BLEU指标

摘要：关于 BLEU（Bilingual Evaluation Understudy）指标的技术分享，从 “是什么→为什么重要→怎么算→怎么用→有什么坑” 的逻辑展开，兼顾基础理解与实践价值。以下是具体分享框架和内容要点，结合案例和通俗解释，让听众（无论新手还是有经验者）都能快速掌握核心：一、为什么需要阅读全文

posted @ 2025-07-29 22:47 limingqi 阅读(634) 评论(0) 推荐(0)

NDCG指标

ROUGE指标

BLEU指标

导航

公告