pandas
pandas 基于numpy创建的
主要功能
具备对其功能的数据结构DataFrame,Series
集成时间序列功能
提供丰富的数学运算和操作
灵活处理缺失数据
series
dataframe
日期
Series

Series 可以使用numpy的基础功能


# series整数索引问题

Series 数据对齐
可能出现问题 都不是修改元数据,会新生成一份数据
缺失数据

--------------------------------------------------------------------

--------------------------------------------------------------------------


DataFrame
列的类型是一致的。



,,,
dataframe 的切片和索引
切片之后 可以reset_index(drop=True)重新设置索引

dataframe数据对齐
sr.fillna(0)
sr.dropna() # s删掉nan 的行
sr.dropna(how='all') # 这一行都是nan才删掉,默认any
sr.dropna(axis=0,where='any')删除一列
sr.isnull()
sr.notnull()
常用函数
df.mean() # 每个元素的平均数(即按列)
df.mean(axis=1) # 按行求平均值
df.sum() 每个元素的和(即按列)
df.sum(axis=1)按行求和
排序:
1、按值排序
2、按行排序
有NAN的默认排在最后
3、按索引排序
df.sort_index()
日期




读取csv文件
有列名
pd.read_tocsv('****.csv',index_col=“指定标签”,parse_dates=True) # pd.read_tocsv('****.csv',index_col=“指定标签”,parse_dates=['dae列‘,]) #
无列明
会把第一行当成列名
pd.read_csv('****.csv',header=None,names=['a',])







浙公网安备 33010602011771号