统计excel中指定列的内容
生成样表
import pandas as pd
# 生成数据
data1 = {
'姓名': ['张三', '李四', '王五'],
'年龄': [25, 30, 35],
'性别': ['男', '男', '女']
}
data2 = {
'姓名': ['赵六', '钱七', '孙八'],
'年龄': [40, 45, 50],
'性别': ['男', '女', '男']
}
# 将数据转换为 DataFrame
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
# 将 DataFrame 写入 Excel 文件,从第二行开始填充
with pd.ExcelWriter('data1.xlsx') as writer:
df1.to_excel(writer, sheet_name='Sheet1', startrow=1, index=False)
with pd.ExcelWriter('data2.xlsx') as writer:
df2.to_excel(writer, sheet_name='Sheet1', startrow=1, index=False)
遍历统计
import os
import pandas as pd
# 获取当前目录
directory = os.getcwd()
# 初始化一个空的 DataFrame 来存储汇总结果
summary_df = pd.DataFrame()
# 遍历目录中的所有文件
for filename in os.listdir(directory):
if filename.endswith('.xlsx'):
# 读取 Excel 文件
df = pd.read_excel(os.path.join(directory, filename), skiprows=1)
# 统计男女数量
gender_count = df['性别'].value_counts()
# 将统计结果添加到汇总 DataFrame 中
summary_df[filename] = gender_count
# 将汇总结果写入到一个新的 Excel 文件中
summary_df.to_excel('summary.xlsx')
summary_df
浙公网安备 33010602011771号