3月25日
newdf=df.groupby('用户编号',as_index=False).size()
print(newdf)
df分组,并生成新的df,注意这个参数as_index=False false 会把用户编号当作一个字段,不然这个字段生成不了,结果是用户编号和size两个字段
该行取各个分组的size的平均值
mean_count=df.groupby('用户编号').size().mean()
该行根据分组,并将缴费金额进行分组总和
df_sum=df.groupby(['用户编号'],as_index=False)['缴费金额(元)'].sum()
该行取分组的缴费金额的平均值
df_mean=df.groupby(['用户编号'],as_index=False)['缴费金额(元)'].mean()
该行将两个结果df聚合成一个df ,两个df有相同的字段用户编号,axis=1 是将字段全部横向组合。结果是这样

res=pd.concat([newdf,df_mean],axis=1)
浙公网安备 33010602011771号