pandas 处理带有合并的单元格


import pandas as pd
from openpyxl import load_workbook

def fill_merged_cells(excel_path, sheet_name=None,withhead=None):
    # 1. 用openpyxl读取工作簿，获取合并区域
    wb = load_workbook(excel_path)
    sheet = wb[sheet_name] if sheet_name else wb.active  # 指定工作表，默认激活的表
    
    # 2. 用pandas读取原始数据（保留NaN）
    df = pd.read_excel(excel_path, sheet_name=sheet_name, engine='openpyxl',header=None if withhead is None else 0)
    
    # 3. 遍历所有合并区域，填充数据（openpyxl的行列从1开始，pandas从0开始）
    for merged_range in sheet.merged_cells.ranges:
        # 获取合并区域的行列范围（转换为pandas的0索引）
        min_row = merged_range.min_row - 1
        max_row = merged_range.max_row - 1
        min_col = merged_range.min_col - 1
        max_col = merged_range.max_col - 1
        
        # 获取左上角单元格的值（合并区域的有效值）
        fill_value = df.iloc[min_row, min_col]
        
        # 填充整个合并区域
        df.iloc[min_row:max_row+1, min_col:max_col+1] = fill_value
    
    return df

# 调用函数（示例：处理test.xlsx的Sheet1）
df_filled = fill_merged_cells("data2\遗址标签分类.xlsx", sheet_name="Sheet1")

posted on 2025-11-28 14:41 张博的博客阅读(24) 评论(0) 收藏举报

刷新页面返回顶部

张博的博客

pandas 处理带有 合并的单元格

导航

pandas 处理带有合并的单元格