一、模型评估与优化

1. 模型评估

1）性能度量

① 错误率与精度

错误率和精度是分类问题中常用的性能度量指标，既适用于二分类任务，也适用于多分类任务.

错误率（error rate）：指分类错误的样本占样本总数的比例，即（分类错误的数量 / 样本总数数量）
精度（accuracy）：指分类正确的样本占样本总数的比例，即（分类正确的数量 / 样本总数数量）

\[精度 +错误率 = 1 \]

② 查准率、召回率与F1得分

错误率和精度虽然常用，但并不能满足所有的任务需求。例如，在一次疾病检测中，我们更关注以下两个问题：

检测出感染的个体中有多少是真正病毒携带者？
所有真正病毒携带者中，有多大比例被检测了出来？

类似的问题在很多分类场景下都会出现，“查准率”（precision）与“召回率”（recall）是更为适合的度量标准。对于二分类问题，可以将真实类别、预测类别组合为“真正例”（true positive）、“假正例”（false positive）、“真反例”（true negative）、“假反例”（false negative）四种情形，见下表：

posted on 2023-04-23 19:07 怪兽饲养员Y 阅读(27) 评论(0) 收藏举报

刷新页面返回顶部

一、模型评估与优化

1. 模型评估

1）性能度量

① 错误率与精度

② 查准率、召回率与F1得分

公告