简单理解pandas的groupby函数

pandas中的groupby函数,可以对数据进行分组,然后对分组后的数据进行聚合操作,比如求和、平均值、最大值、最小值等。平时使用groupby处理后,通常使用aggregate函数进行聚合操作。其实,groupby分组之后的聚合操作方法还很多,具体可以参考官方文档。

1. 读取数据

dataframe=pd.DataFrame({'name':['Joe','Jim','Henry','Sam','Max',],'salary':[70000,90000,80000,60000,90000,],'department':['IT','IT','Sales','Sales','IT',]})
其中,name是员工姓名,salary是员工薪资,department是员工所属部门。问题是:如何找出每个部门最高的薪资?

2. groupby处理

dataframe_max= dataframe.groupby(['department'],as_index=False).aggregate({'salary':'max'})
其中,groupby对department就行分组处理;as_index=False表示不使用分组的列作为索引,否则会出现多级索引。aggregate函数表示对分组后的数据进行聚合操作,{'salary':'max'}表示对salary列进行最大值操作。
posted @ 2024-10-10 17:35  stone9693  阅读(137)  评论(0)    收藏  举报
GitHub账户:https://github.com/stone9693