统计excel中指定列的内容

生成样表

import pandas as pd

# 生成数据
data1 = {
    '姓名': ['张三', '李四', '王五'],
    '年龄': [25, 30, 35],
    '性别': ['男', '男', '女']
}

data2 = {
    '姓名': ['赵六', '钱七', '孙八'],
    '年龄': [40, 45, 50],
    '性别': ['男', '女', '男']
}

# 将数据转换为 DataFrame
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

# 将 DataFrame 写入 Excel 文件,从第二行开始填充
with pd.ExcelWriter('data1.xlsx') as writer:
    df1.to_excel(writer, sheet_name='Sheet1', startrow=1, index=False)

with pd.ExcelWriter('data2.xlsx') as writer:
    df2.to_excel(writer, sheet_name='Sheet1', startrow=1, index=False)


遍历统计

import os
import pandas as pd

# 获取当前目录
directory = os.getcwd()

# 初始化一个空的 DataFrame 来存储汇总结果
summary_df = pd.DataFrame()

# 遍历目录中的所有文件
for filename in os.listdir(directory):
    if filename.endswith('.xlsx'):
        # 读取 Excel 文件
        df = pd.read_excel(os.path.join(directory, filename), skiprows=1)
        
        # 统计男女数量
        gender_count = df['性别'].value_counts()
        
        # 将统计结果添加到汇总 DataFrame 中
        summary_df[filename] = gender_count

# 将汇总结果写入到一个新的 Excel 文件中

summary_df.to_excel('summary.xlsx')
summary_df

posted @ 2024-12-12 23:25  redufa  阅读(32)  评论(0)    收藏  举报