遍历生成dataframe
真丢人 我居然不会写这个 今天整理了赶紧加上去
生成数据的分布 观察指定列
def read_data_range(df,step,ranges,type): # step=100000 #,'分位数 25','分位数 50','分位数 75','标准差' dff = pd.DataFrame(columns=['区间下限', '区间上限','区间人数','区间均值','区间标准差','区间最小值','区间最大值','分位数 25','分位数 50','分位数 75']) for i in range(1,ranges): q=df[df['follower_cnt']<= step * i] q=q[q['follower_cnt'] >= step *(i-1)] dff = dff.append({'区间下限':step * (i - 1), '区间上限':step * i, '区间人数':q[type].count(),'区间均值':q[type].mean(),'区间标准差':q[type].std(),'区间最小值':q[type].min(),'区间最大值':q[type].max(),'分位数 25':q[type].quantile(0.25),'分位数 50':q[type].quantile(0.5),'分位数 75':q[type].quantile(0.75)}, ignore_index=True)

浙公网安备 33010602011771号