import os
import pandas as pd
stock_code_list = []
for root,dirs,files in os.walk('stock data'):
if files:
for f in files:
if '.csv' in f:
stock_code_list.append(f.split('.csv')[0])
all_stock = pd.DataFrame()
for code in stock_code_list:
if code[2]!='3':
continue
print(code)
stock_data = pd.read_csv('stock data/'+code+'.csv',parse_dates=[1])
stock_data = stock_data[stock_data['PE_TTM'].notnull()]#删除PE_TTM为空的行
#PE_TTM = 总市值/净利润_TTM,这里通过这个公式计算净利润_TTM
stock_data['净利润']=stock_data['market_value']/stock_data['PE_TTM']
#选取需要的字段,去除其他不需要的字段
stock_data = stock_data[['code','date','market_value','净利润']]
#将该股票的合并
all_stock = all_stock.append(stock_data,ignore_index=True)
#基于all_stock表格,通过groupby语句,计算创业板股票每天的平均市盈率
#通过groupby语句计算每天所有股票的市值之各、净利润之和,以及当天交易的股票的数量
output = all_stock.groupby('date')[['market_value','净利润']].sum()
output['股票数量'] = all_stock.groupby('date').size()
#平均市盈率=所有股票的市值之和/所有股票的净利润之和
output['创业板平均市盈率'] = output['market_value']/output['净利润']
#算好的数据输出
output.to_csv('创业板平均市盈率.csv',encoding='gbk')