pandas

pandas  基于numpy创建的

主要功能
    具备对其功能的数据结构DataFrame,Series
    集成时间序列功能
    提供丰富的数学运算和操作
    灵活处理缺失数据

 

series
dataframe
日期

 

Series 

 

Series 可以使用numpy的基础功能

 

 

 

 # series整数索引问题

Series 数据对齐
可能出现问题      都不是修改元数据,会新生成一份数据
缺失数据


--------------------------------------------------------------------

--------------------------------------------------------------------------

 

 

 

 

 

DataFrame

列的类型是一致的。

 

 

 

 

 

 

 

 

 

 

 

 

,,,

   

dataframe 的切片和索引
切片之后    可以reset_index(drop=True)重新设置索引

 

 

 dataframe数据对齐
sr.fillna(0)
sr.dropna()  # s删掉nan 的行
sr.dropna(how='all') # 这一行都是nan才删掉,默认any

sr.dropna(axis=0,where='any')删除一列
sr.isnull()
sr.notnull()
 常用函数

 

df.mean()  # 每个元素的平均数(即按列)
df.mean(axis=1)  # 按行求平均值

df.sum()   每个元素的和(即按列)
df.sum(axis=1)按行求和

排序:
1、按值排序

 

2、按行排序
有NAN的默认排在最后

3、按索引排序
df.sort_index()


 

 日期

 

 

 

 

 

 

 

 读取csv文件

有列名
pd.read_tocsv('****.csv',index_col=“指定标签”,parse_dates=True)  # pd.read_tocsv('****.csv',index_col=“指定标签”,parse_dates=['dae列‘,])  #
无列明
会把第一行当成列名
pd.read_csv('****.csv',header=None,names=['a',])

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

posted @ 2019-03-28 10:24  慕沁  阅读(169)  评论(0)    收藏  举报