朴素贝叶斯分类器
朴素贝叶斯分类器认为样本的每个特征都是独立的


分类问题:混淆矩阵、F1、ROC和AUC

多分类问题的混淆矩阵:


对于根据老鼠体重来判断老鼠是否肥胖的二分类障碍,使用罗辑回归的方式,并将阈值设置为0.5,高于这个阈值就认为老鼠肥胖

根据这个模型,能够得到分类的正确和错误情况:


通过设置不同的阈值,能够得到不同的分类结果和混淆矩阵
ROC曲线 (Receiver Operator Characteristic)

真阳性率(灵敏度):


特异度


ROC曲线中,越接近左上角,模型的效果越好

AUC (Area Under the Curve)
AUC越大的模型效果越好

各种分布的意义:
泊松分布:描述单位时间/空间内某事件的发生次数
指数分布:连续时间下首次事件发生时间(连续)
二项分布:固定次数试验中成功次数
几何分布:首次成功的试验次数 (离散)
指数分布和几何分布的区别:

浙公网安备 33010602011771号