摘要: 一、了解缺失值 通常使用 NA('not available')来代指缺失值 在Pandas的数据结构中,缺失值使用 NaN('Not a Number')进行标识 除了汇总统计方法,还可以使用isnull()来对数据中缺失的样本占比、特征大致的缺失情况进行了解。 >>> df =pd.DataFr 阅读全文
posted @ 2020-07-26 22:06 大脸猫12581 阅读(1224) 评论(0) 推荐(0) 编辑
摘要: 一、常用的描述性统计函数 函数 作用 函数 作用 count 非缺失样本的数量 sum 求和 mean 均值 mad 平均绝对偏差(Mean absolute deviation) median 中位数 min 最小值 max 最大值 mode 众数 abs 绝对值 prod 乘积 std 标准差 阅读全文
posted @ 2020-07-26 20:30 大脸猫12581 阅读(869) 评论(0) 推荐(2) 编辑
摘要: 一、数据类型 1、Pandas的数据类型主要结合了pandas和numpy两个模块中的数据类型,包括以下几种: float int bool datetime64[ns] >日期类型 datetime64[ns,tz] >日期类型 timedelta[ns] >时间差类型 category obje 阅读全文
posted @ 2020-07-26 18:58 大脸猫12581 阅读(916) 评论(0) 推荐(1) 编辑