# 机器学习评判指标

## 0.背景

• 准确度PR (Precision Recall)
• F测量
• [ ] MCC
• [ ] BM
• [ ] MK
• [ ] Gini系数
• ROC
• [ ] Z score
• AUC
• [ ] Cost Curve
• [ ] BLEU
• [ ] Matthews correlation coefficient
• [ ] METEOR
• [ ] Brier score
• [ ] NIST (metric)
• [ ] ROUGE (metric)
• [ ] Sørensen–Dice coefficient
• [ ] Uncertainty coefficient, aka Proficiency
• [ ] Word error rate (WER)

• true condition：列表示真实类别；predicted condition：行表示预测的类别；
• 真实正类=true positive+false negative；真实负类=false positive+true negative；
• 预测的正类=true positive+false positive； 预测的负类=false negative+true negative。

## 1. 不同指标的含义

### 1.1 accuracy&Precision Recall

• accuracy：（图0.1中ACC）即最常用的准确度，表示$\frac{所有预测对了的样本个数}{总的样本个数}$
• Precision：（图0.1中PPV），精确率，表示预测的正类中预测对的样本个数比例$\frac{true\, positive}{预测的正类}$
• Recall：（图0.1中TPR），召回率，表示真实正类中预测对的样本个数比例$\frac{true\, positive}{真实正类}$.

### 1.2 F measure&&G measure

#### 1.2.1 F measure

• 当F score为0的时候最差：即precision和recall中某个值或者都接近0，则该模型越差；
• 当F score为1的时候最好：即precision和recall同时越接近1则该模型越好。

ps：F1 score同样也被称为Sørensen–Dice coefficient或者说叫Dice similarity coefficient (DSC).

• $\beta=2$，则表示recall的影响要大于precision；
• $\beta=0.5$，则表示precision的影响要大于recall.

### 1.5 ROC

AUC：Aera under curve，即表示曲线下面积的意思

## 2. 不同指标之间的关系

### 2.3 AUC的探讨

