摘要: 一、介绍 Python 中利用 pd.value_counts() 函数对数据频次进行统计。 该函数返回一个序列 Series ,包含每个值的数量。 使用语法为: Series.value_counts(normalize=False, # 是否显示占比 sort=True, # 是否排序 asce 阅读全文
posted @ 2022-01-04 17:42 Hider1214 阅读(2618) 评论(0) 推荐(0)
摘要: 一、理论介绍 虚拟变量(dummy variable)也叫哑变量,是一种将多分类变量转换为二分变量的一种形式。 如果多分类变量有k个类别,则可以转化为k-1个二分变量。 需要有一个参照的类别。 在非线性关系的模型中,特别重要。 在模型分析时,虚拟变量都是同进同出,要么都在模型中,要么都不在模型中,不 阅读全文
posted @ 2022-01-04 14:47 Hider1214 阅读(6316) 评论(0) 推荐(0)