ryanryan

 

Pandas 查询、过滤、采样

Pandas
df.shape
df.head()
df.iloc[:9]
df.query('col1 == 1 & col2 == 1')
df[(df.col1 == 1) & (df.col2 == 1)]
df[['col1', 'col2']]
df.loc[:, 'col1':'col3']
df.drop(cols_to_drop, axis=1)但是看[1]

df[['col1']].drop_duplicates()
df[['col1', 'col2']].drop_duplicates()
df.sample(n=10)
df.sample(frac=0.01)
Pandas 的写法,如果您有列的列表,例如 df[cols[1:3] 或 df.drop(cols[1:3]),按列名执行此操作可能会引起混乱。

Pandas
df.sort_values(['col1', 'col2'])
df.sort_values('col1', ascending=False)

Pandas
df.rename(columns={'col1': 'col_one'})['col_one']
df.rename(columns={'col1': 'col_one'})
df.assign(c=df.a-df.b)

Pandas
df.describe()
gdf = df.groupby('col1')
df.groupby('col1').agg({'col1': 'mean'})
df.groupby('col1').sum()

posted on 2020-10-28 15:49  ryanryan  阅读(147)  评论(0)    收藏  举报

导航