摘要: 欠采样:若随机丢失反例,可能丢失一些重要信息。代表性算法EasyEnsemble是利用集成学习机制,将多数类样本划分若干个集合供不同学习器使用,这样对每个学习器来看都进行了欠采样,但在全局来看不会丢失信息。 过采样:不能简单的对初始样本进行重复采样,否则会招致严重的过拟合。代表性算法SMOTE,对训 阅读全文
posted @ 2019-09-05 09:31 你爱谈天我爱笑 阅读(192) 评论(0) 推荐(0) 编辑