3月25日

newdf=df.groupby('用户编号',as_index=False).size()


print(newdf)

 

df分组,并生成新的df,注意这个参数as_index=False false 会把用户编号当作一个字段,不然这个字段生成不了,结果是用户编号和size两个字段

 

该行取各个分组的size的平均值

mean_count=df.groupby('用户编号').size().mean()

 

 

该行根据分组,并将缴费金额进行分组总和

df_sum=df.groupby(['用户编号'],as_index=False)['缴费金额(元)'].sum()

 

该行取分组的缴费金额的平均值

df_mean=df.groupby(['用户编号'],as_index=False)['缴费金额(元)'].mean()

 

 

 

 

该行将两个结果df聚合成一个df ,两个df有相同的字段用户编号,axis=1 是将字段全部横向组合。结果是这样

 

 

 

res=pd.concat([newdf,df_mean],axis=1)

posted @ 2022-03-25 23:14  不咬牙  阅读(33)  评论(0)    收藏  举报