Title

第二次吃瓜 第三章

Posted on 2022-10-14 16:27  CuiQi  阅读(33)  评论(0)    收藏  举报

今日再度西瓜书,发现实战中用过的地方理解的最深入

今天想着重整理类别不平衡问题

基本策略:再缩放

欠采样,过采样与阈值移动

其中欠采样和过采样都不建议直接复制或删除,而是建议用不同的策略进行。

如过采样用GAN生成或者用差值生成,欠采样将多的例划分为若干集合,供不同学习器使用。从全局看不会丢失信息,从单个分类器看,多例被欠采样。