样本不均衡问题

1.过采样,多次训练小数量的类别或者把小类别造数据,比如一些数据增强的方式

2.降采样,多的类别只选部分来寻来呢

3.每个batch里面类别尽量均衡

4.在loss里面加权重

5.ohem,因为可能类别比较多,训练网络久了,也许loss就小了

6.分治ensemble
将大类中样本聚类到L个聚类中,然后训练L个分类器;每个分类器使用大类中的一个簇与所有的小类样本进行训练得到;最后对这L个分类器采取少数服从多数对未知类别数据进行分类,如果是连续值(预测),那么采用平均值。

https://blog.csdn.net/songhk0209/article/details/71484469

https://blog.csdn.net/qq_14845119/article/details/78930091

posted @ 2018-08-23 22:36  有梦就要去实现他  阅读(193)  评论(0编辑  收藏  举报