摘要:
总结:不平衡数据的分类,(1)数据层面:使用过采样是主流,过采样通常使用smote,或者少数使用数据复制。过采样后模型选择RF、xgboost、神经网络能够取得非常不错的效果。(2)模型层面:使用模型集成,样本不做处理,将各个模型进行特征选择、参数调优后进行集成,通常也能够取得不错的结果。(3)其他 阅读全文
posted @ 2018-05-25 17:44
bonelee
阅读(3427)
评论(0)
推荐(0)
摘要:
from:https://zhuanlan.zhihu.com/p/30461746 本项目需解决的问题 本项目通过利用信用卡的历史交易数据,进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件。 建模思路 项目背景 以上取自Kaggle官网对本数据集部分介绍(谷歌翻译),关于数据 阅读全文
posted @ 2018-05-25 12:11
bonelee
阅读(15271)
评论(0)
推荐(2)
摘要:
先看数据: 特征如下: Time Number of seconds elapsed between each transaction (over two days) numeric V1 No description provided numeric V2 No description provi 阅读全文
posted @ 2018-05-25 10:47
bonelee
阅读(9493)
评论(5)
推荐(0)
摘要:
You are given a binary tree in which each node contains an integer value. Find the number of paths that sum to a given value. The path does not need t 阅读全文
posted @ 2018-05-25 00:01
bonelee
阅读(192)
评论(0)
推荐(0)

浙公网安备 33010602011771号