简单理解pandas的groupby函数

pandas中的groupby函数，可以对数据进行分组，然后对分组后的数据进行聚合操作，比如求和、平均值、最大值、最小值等。平时使用groupby处理后，通常使用aggregate函数进行聚合操作。其实，groupby分组之后的聚合操作方法还很多，具体可以参考官方文档。

1. 读取数据

dataframe=pd.DataFrame({'name':['Joe','Jim','Henry','Sam','Max',],'salary':[70000,90000,80000,60000,90000,],'department':['IT','IT','Sales','Sales','IT',]})
其中，name是员工姓名，salary是员工薪资，department是员工所属部门。问题是：如何找出每个部门最高的薪资？

2. groupby处理

dataframe_max= dataframe.groupby(['department'],as_index=False).aggregate({'salary':'max'})
其中，groupby对department就行分组处理；as_index=False表示不使用分组的列作为索引，否则会出现多级索引。aggregate函数表示对分组后的数据进行聚合操作，{'salary':'max'}表示对salary列进行最大值操作。

posted @ 2024-10-10 17:35 stone9693 阅读(157) 评论(0) 收藏举报

刷新页面返回顶部

stone

工作：python，数据，模型，统计，web后端；
爱好：英超，历史，讨论，聊天，侃大山；

简单理解pandas的groupby函数

1. 读取数据

2. groupby处理

公告

stone

工作：python，数据，模型，统计，web后端； 爱好：英超，历史，讨论，聊天，侃大山；

简单理解pandas的groupby函数

1. 读取数据

2. groupby处理

公告

工作：python，数据，模型，统计，web后端；
爱好：英超，历史，讨论，聊天，侃大山；