雷毅

导航

《利用Python进行数据分析》第7章学习笔记

数据规整化:清理、转换、合并、重塑

合并数据集

pandas.merge

pandas.concat

combine_first

数据库风格的DataFrame合并

索引上的合并

join()实例方法

轴向连接

NumPy中有concatenation

pandas中concat()

合并重叠数据

NumPy中的where()

pandas中的combine_first

重塑和轴向旋转

重塑层次化索引

stack() 列到行

unstack() 行到列

将长格式旋转为宽格式

不懂

数据转换

移除重复数据

DataFrame的duplicated()方法

drop_duplicates()

利用函数或映射进行数据转换

Series的map()方法

替换值

replace()

重命名轴索引

rename()

离散化和面元划分

pandas的cut()

检测和过滤异常值

布尔型DataFrame和any()

排列和随机采样

利用numpy.random.permutation()函数

计算指标/哑变量

pandas中的get_dummies()

字符串操作

字符串对象方法

split()和strip()

join()

检测子串 in和index,find

count()

replace()

正则表达式

pandas中矢量化的字符串函数

 

posted on 2016-09-29 16:00  雷毅  阅读(206)  评论(0编辑  收藏  举报