pandas 处理带有 合并的单元格


import pandas as pd
from openpyxl import load_workbook

def fill_merged_cells(excel_path, sheet_name=None,withhead=None):
    # 1. 用openpyxl读取工作簿,获取合并区域
    wb = load_workbook(excel_path)
    sheet = wb[sheet_name] if sheet_name else wb.active  # 指定工作表,默认激活的表
    
    # 2. 用pandas读取原始数据(保留NaN)
    df = pd.read_excel(excel_path, sheet_name=sheet_name, engine='openpyxl',header=None if withhead is None else 0)
    
    # 3. 遍历所有合并区域,填充数据(openpyxl的行列从1开始,pandas从0开始)
    for merged_range in sheet.merged_cells.ranges:
        # 获取合并区域的行列范围(转换为pandas的0索引)
        min_row = merged_range.min_row - 1
        max_row = merged_range.max_row - 1
        min_col = merged_range.min_col - 1
        max_col = merged_range.max_col - 1
        
        # 获取左上角单元格的值(合并区域的有效值)
        fill_value = df.iloc[min_row, min_col]
        
        # 填充整个合并区域
        df.iloc[min_row:max_row+1, min_col:max_col+1] = fill_value
    
    return df

# 调用函数(示例:处理test.xlsx的Sheet1)
df_filled = fill_merged_cells("data2\遗址标签分类.xlsx", sheet_name="Sheet1")

posted on 2025-11-28 14:41  张博的博客  阅读(0)  评论(0)    收藏  举报

导航