python对excel文件中指定表格的指定列数据进行去重复操作。

import pandas as pd

# 读取Excel文件
df_all = pd.read_excel('域名管理系统.xlsx', sheet_name=None, engine='openpyxl')

# 确保'01流水'表存在
if '01流水' in df_all:
    # 提取第1列第2行至第1000行的数据并去重
    df_two = df_all['01流水']
    unique_data = df_two.iloc[1:1000, 0].drop_duplicates().reset_index(drop=True)

    # 检查并处理'01流水-去重'表
    if '01流水-去重' in df_all:
        # 删除原有的'01流水-去重'表
        del df_all['01流水-去重']

    # 将去重后的数据添加为新的'01流水-去重'表
    df_all['01流水-去重'] = unique_data

    # 保存更新后的Excel文件
    with pd.ExcelWriter('域名管理系统.xlsx', engine='openpyxl') as writer:
        for sheet_name, data_frame in df_all.items():
            data_frame.to_excel(writer, sheet_name=sheet_name, index=False)
else:
    print("Sheet '01流水-去重' not found in the Excel file.")

上述代码由阿里云lingma完成。

功能：将one.xlsx文件中表two中第1列第2行至1000行的数据进行去重，并将结果保存到two-uni表格，如果two-uni已存在，则删除原表格。

需要：我们可以使用pandas库来处理Excel文件。

pip install pandas openpyxl

posted @ 2024-06-03 10:40 POTUS88 阅读(326) 评论(0) 收藏举报

刷新页面返回顶部

python对excel文件中指定表格的指定列数据进行去重复操作。

公告