遍历生成dataframe

真丢人 我居然不会写这个 今天整理了赶紧加上去

生成数据的分布 观察指定列

 

def read_data_range(df,step,ranges,type):
    # step=100000
    #,'分位数 25','分位数 50','分位数 75','标准差'
    dff = pd.DataFrame(columns=['区间下限', '区间上限','区间人数','区间均值','区间标准差','区间最小值','区间最大值','分位数 25','分位数 50','分位数 75'])

    for i in range(1,ranges):
        q=df[df['follower_cnt']<= step * i]
        q=q[q['follower_cnt'] >= step *(i-1)]
        dff = dff.append({'区间下限':step * (i - 1), '区间上限':step * i, '区间人数':q[type].count(),'区间均值':q[type].mean(),'区间标准差':q[type].std(),'区间最小值':q[type].min(),'区间最大值':q[type].max(),'分位数 25':q[type].quantile(0.25),'分位数 50':q[type].quantile(0.5),'分位数 75':q[type].quantile(0.75)}, ignore_index=True)

 

posted @ 2022-06-20 11:22  土星狗蛋  阅读(121)  评论(0)    收藏  举报