将数据进行聚合操作之统计同特征下同字段的数量 并保存为数据集合 - 数据转格式化处理

##############################
#统计特征SB下XX数据有几个,并保存


#适用于
#featureA   featureB
#SDF          345
#SDF          976
#KKj           3
#KKj           43
#KKj          34556

#想转为
#featureA   写进数据集的特征名
#SDF              2
#KKj              3
##############################

import pandas as pd
path="resource"
data_set=pd.read_csv(path+'/'+'文件名字',encoding='utf8')

df=data_set.groupby(['SB'])['xx数据'].agg(len)
keyword="写进数据集的特征名"
dfss=pd.DataFrame(columns={'SB',keyword})
dfss[keyword]=df
dfss['SB']=df.index


dfss=dfss.to_csv('处理后的数据/'+keyword+'数据.csv',encoding='utf8',index=False)

 

posted @ 2022-08-30 11:56  土星狗蛋  阅读(81)  评论(0)    收藏  举报