Pandas的一些简单函数总结

pd.Series(my_list) # 从一个可迭代的对象 my_list 中创建一个数据组
df.index = pd.date_range('2017/1/1', periods=df.shape[0]) # 添加一个日期索引 index
df.tail(n) # 查看数据框的最后n行
df.set_index('column_one') # 改变索引
s.value_counts(dropna=False) # 查询每个独特数据值出现次数统计
df.dropna() # 移除数据框 DataFrame 中包含空值的行
df.dropna(axis=1) # 移除数据框 DataFrame 中包含空值的列
df.dropna(axis=1,thresh=n) # 移除数据框df中空值个数不超过n的行
df.fillna(x) # 将数据框 DataFrame 中的所有空值替换为 x
df.sort_values(col1) # 按照数据框的列col1升序(ascending)的方式对数据框df做排序
df.sort_values(col2,ascending=False) # 按照数据框的列col2降序(descending)的方式对数据框df做排序
df.pivot_table(index=col1,values=[col2,col3],aggfunc=mean) # 做透视表,索引为col1,针对的数值列为col2和col3,分组函数为平均值
df.corr() # 得到数据框df中每一列与其他列的相关系数
df.count() # 得到数据框df中每一列的非空值个数

 

未完待续。。。。
posted @ 2018-03-27 16:48  布尔先生  阅读(221)  评论(0编辑  收藏  举报