import pandas as pd
from openpyxl import load_workbook
def fill_merged_cells(excel_path, sheet_name=None,withhead=None):
# 1. 用openpyxl读取工作簿,获取合并区域
wb = load_workbook(excel_path)
sheet = wb[sheet_name] if sheet_name else wb.active # 指定工作表,默认激活的表
# 2. 用pandas读取原始数据(保留NaN)
df = pd.read_excel(excel_path, sheet_name=sheet_name, engine='openpyxl',header=None if withhead is None else 0)
# 3. 遍历所有合并区域,填充数据(openpyxl的行列从1开始,pandas从0开始)
for merged_range in sheet.merged_cells.ranges:
# 获取合并区域的行列范围(转换为pandas的0索引)
min_row = merged_range.min_row - 1
max_row = merged_range.max_row - 1
min_col = merged_range.min_col - 1
max_col = merged_range.max_col - 1
# 获取左上角单元格的值(合并区域的有效值)
fill_value = df.iloc[min_row, min_col]
# 填充整个合并区域
df.iloc[min_row:max_row+1, min_col:max_col+1] = fill_value
return df
# 调用函数(示例:处理test.xlsx的Sheet1)
df_filled = fill_merged_cells("data2\遗址标签分类.xlsx", sheet_name="Sheet1")