pandas 必学: 聚合算法. groupby
2024-12-06,16点06
pandas 必学: 聚合算法. 按照tabel_name 聚合, 然后算data列的max . max可以用agg函数来自定义.
biaojiegou2.groupby('table_name')['score'].mean().reset_index()
自定义:
import pandas as pd
import numpy as np
# 创建一个示例DataFrame
data = {
'Category': ['A', 'B', 'A', 'B', 'C', 'A', 'C', 'B'],
'Data': [10, 20, 30, 40, 50, 60, 70, 80],
'Data2': [120, 202, 30, 40, 50, 60, 70, 80]
}
df=pd.DataFrame(data)
# 按照'Category'列进行分组,并对'Data'列进行求和聚合
grouped_sum1 = df.groupby('Category').sum()
grouped_sum2 = df.groupby('Category').agg({"Data":lambda x:x.mean()+x.max()})
# 按照'Category'列进行分组,并对'Data'列进行平均值聚合
def fun1(s):
return {}
result = df.groupby('Category')['Data'].max().reset_index()
# print(grouped_sum)
print(result.iloc[0])