摘要:
所谓不平衡指的是:不同类别的样本数量差异非常大。 数据规模上可以分为大数据分布不均衡和小数据分布不均衡。大数据分布不均衡:例如拥有1000万条记录的数据集中,其中占比50万条的少数分类样本便于属于这种情况。小数据分布不均衡:例如拥有1000条数据样本的数据集中,其中占有10条的少数分类样本便于属于这 阅读全文
posted @ 2019-07-08 21:42
做梦当财神
阅读(8335)
评论(0)
推荐(1)
摘要:
1. groupby() 2. 聚合方法size()和count() size跟count的区别: size计数时包含NaN值,而count不包含NaN值 count() size() 来自:https://blog.csdn.net/m0_37870649/article/details/8097 阅读全文
posted @ 2019-07-08 19:59
做梦当财神
阅读(12570)
评论(0)
推荐(0)