3月25日

newdf=df.groupby('用户编号',as_index=False).size()

print(newdf)

df分组，并生成新的df，注意这个参数as_index=False false 会把用户编号当作一个字段，不然这个字段生成不了，结果是用户编号和size两个字段

该行取各个分组的size的平均值

mean_count=df.groupby('用户编号').size().mean()

该行根据分组，并将缴费金额进行分组总和

df_sum=df.groupby(['用户编号'],as_index=False)['缴费金额（元）'].sum()

该行取分组的缴费金额的平均值

df_mean=df.groupby(['用户编号'],as_index=False)['缴费金额（元）'].mean()

该行将两个结果df聚合成一个df ，两个df有相同的字段用户编号，axis=1 是将字段全部横向组合。结果是这样

res=pd.concat([newdf,df_mean],axis=1)

posted @ 2022-03-25 23:14 不咬牙阅读(35) 评论(0) 收藏举报

刷新页面返回顶部