ml 逻辑回归-信用卡欺诈检测项目实战

实战目的:在检索了几十万的数据之后,对数据进行分析,需要检索有哪些是信用卡异常的用户。给出合理的模型使得预测值与实际相近。

学到的东西:样本不均衡解决方案(过采样与下采样)、交叉验证、模型评估方法(recall值)、正则化惩罚、逻辑回归模型、混淆矩阵、逻辑回归的阈值对模型结果的影响、SMOTE算法解决非平衡样本数据(过采样)

具体内容暂时懒得写。上述东西在代码中就能看到。我在注释中给出了详细的说明及一些自己的理解。看到想了解的加我qq761256405找我要。博客园狗的是python的代码文件不让传,小小吐槽一波。

在条件允许的情况下,优先使用smote算法使样本变多,利用过采样弄出的模型会降低误杀率,使模型效果更好

 

posted @ 2018-09-03 12:52  ivanthor  阅读(417)  评论(0)    收藏  举报