模型的评估方式
一、分类评估指标:
1.二分类评估方式:包含召回率(查全率)、精确率(查准率)、f1-score
from sklearn.metrics import accuracy_score
from sklearn.metrics import recall_score
from sklearn.metrics import precision_score
from sklearn.metrics import f1_score
print ("准确率为:" ,accuracy_score(y_test, y_predict))
print ("召回率为:" ,recall_score(y_test, y_predict, average='macro'))
print ("精确率为:" ,precision_score(y_test, y_predict, average='macro'))
print ("f1-score为:" ,precision_score(y_test, y_predict, average='macro'))
精确率:Precision是针对预测结果而言的。预测结果中,预测为正的样本中预测正确的概率。类似于一个考生在考卷上写出来的答案中,正确了多少。体现模型的精准度,模型说:我说哪个对哪个就是对的。
召回率:Recall是针对数据样本而言的。数据样本中,正样本中预测正确的概率。类似于一个考生在考卷上回答了多少题。体现一个模型的全面性,模型说:所有对的我都能找出来。
F1分数(F1 Score),是统计学中用来衡量二分类模型精确度的一种指标。它同时兼顾了分类模型的精确率和召回率 。F1分数可以看作是模型精确率和召回率的一种调和平均,它的最大值是1,最小值是0。
理想情况下,精确率和召回率两者都越高越好。然而事实上这两者在某些情况下是矛盾的,精确率高时,召回率低;精确率低时,召回率高;关于这个性质通过观察PR曲线不难观察出来。比如在搜索网页时,如果只返回最相关的一个网页,那精确率就是100%,而召回率就很低;如果返回全部网页,那召回率为100%,精确率就很低。因此在不同场合需要根据实际需求判断哪个指标跟重要。
2.多分类评估方式:
from sklearn.metrics import classification_report
print(classification_report(y_true, y_pred))
建立一个显示主要分类指标的文本报告。
二、聚类评估指标:

浙公网安备 33010602011771号