摘要:在机器学习中,我们常常会遇到不均衡的数据集。比如癌症数据集中,癌症样本的数量可能远少于非癌症样本的数量;在银行的信用数据集中,按期还款的客户数量可能远大于违约客户的样本数量。 比如非常有名的德国信用数据集,正负样本的分类就不是很均衡: 如果不做任何处理简单地进行训练,那么训练结果中(以SVM为例), 阅读全文
posted @ 2018-08-22 21:27 rgvb178 阅读 (1147) 评论 (0) 编辑