pandas 必学: 聚合算法. groupby

2024-12-06,16点06

pandas 必学: 聚合算法. 按照tabel_name 聚合, 然后算data列的max . max可以用agg函数来自定义.

biaojiegou2.groupby('table_name')['score'].mean().reset_index()

自定义:

import pandas as pd
import numpy as np
# 创建一个示例DataFrame
data = {
    'Category': ['A', 'B', 'A', 'B', 'C', 'A', 'C', 'B'],
    'Data':      [10,  20,  30,  40,  50,   60,  70,   80],
    'Data2': [120, 202, 30, 40, 50, 60, 70, 80]
}

df=pd.DataFrame(data)
# 按照'Category'列进行分组,并对'Data'列进行求和聚合
grouped_sum1 = df.groupby('Category').sum()

grouped_sum2 = df.groupby('Category').agg({"Data":lambda x:x.mean()+x.max()})
 
# 按照'Category'列进行分组,并对'Data'列进行平均值聚合
def fun1(s):
  return {}
result = df.groupby('Category')['Data'].max().reset_index()
 
# print(grouped_sum)
print(result.iloc[0])

posted on 2024-12-11 16:49  张博的博客  阅读(13)  评论(0)    收藏  举报

导航