摘要: 在机器学习中,经常会对数据进行分箱处理操作,即将一段连续的值切分为若干段,每一段的值当成一个分类。 这个将连续值转换成离散值的过程,就是分箱处理。 例如:把年龄划分为18岁以下、18-30岁、30-45岁、45-60岁、60岁以上等5个标签(类别)。 Pandas 包中的 cut 和 qcut 都可 阅读全文
posted @ 2021-11-01 16:56 Hider1214 阅读(9614) 评论(0) 推荐(0)
摘要: 一、pd.filter函数 1.介绍 pd.filter 函数根据指定的索引标签对数据框行、或列进行数据筛选(子集查询)。 使用语法为: DataFrame.filter(items=None, like=None, -- str regex=None, -- str axis=None) 类似于 阅读全文
posted @ 2021-11-01 12:56 Hider1214 阅读(7761) 评论(0) 推荐(1)