panda

import numpy as np
import pandas as pd

#np的nan属性表示为空,值NaN。panda默认数据格式为float64
s=pd.Series([1,2,3,4,np.nan,44,1])
datas=pd.date_range('20200101',periods=6) #periods个数
# print(datas)
df=pd.DataFrame(np.random.randn(6,4),index=datas,columns=['a','b','c','d'])
# radn(x,y)生成x行y列的序列
#index行名称,columns列名称

#排序
# 1:名称排序
# df.sort_index(axis=1,ascending=False)
#axis 0行排序,1列排序
# ascending True为正排序,False逆排序
# 2:列排序
# df.sort_values(by=x)可以针对x排序
# 3:索引排序df['a']或者df.a,切片排序df[0:3]
#4:标签索引
# df.loc['20200101',['a','b']]
# 索引出行为20200101,列为a,b的数据
# 5:位置索引
# df.iloc[1,1] 第一行第一列的数据
# 6标签索引加位置索引

#赋值
# 位置赋值df.loc[2,2]或者标签赋值df.loc['20200101','a']
# df[df.a>0]=1 a大于0的数全部赋值给1
# df.a[df.a>0]=1 a大于0的每行的a都改为1
# df['a']=np.nan a列的数据都为NaN
# df['e']=pd.Series([1,2,3,4,5,6],index=pd.date_range('20200101',periods=6)) 增加一列数据

#处理丢失的数据
# df.dropna(axis=0,how='any')
#axis=0丢掉行,axis=1丢掉列
# how=any这一行只要有一个数据为NaN就丢掉,how=all只有全部为NaN才丢掉

# df.fillna(value=0)将数据为NaN的填充为0
# df.isnull()判断是否缺失数据  True缺失数据,False不缺失数据
#np.any(df.isnull())==True 判断df中是否含有True,是为True

  

posted @ 2021-02-23 20:06  沙漠行走的骆驼  阅读(220)  评论(0)    收藏  举报