python对excel文件中指定表格的指定列数据进行去重复操作。
import pandas as pd
# 读取Excel文件
df_all = pd.read_excel('域名管理系统.xlsx', sheet_name=None, engine='openpyxl')
# 确保'01流水'表存在
if '01流水' in df_all:
# 提取第1列第2行至第1000行的数据并去重
df_two = df_all['01流水']
unique_data = df_two.iloc[1:1000, 0].drop_duplicates().reset_index(drop=True)
# 检查并处理'01流水-去重'表
if '01流水-去重' in df_all:
# 删除原有的'01流水-去重'表
del df_all['01流水-去重']
# 将去重后的数据添加为新的'01流水-去重'表
df_all['01流水-去重'] = unique_data
# 保存更新后的Excel文件
with pd.ExcelWriter('域名管理系统.xlsx', engine='openpyxl') as writer:
for sheet_name, data_frame in df_all.items():
data_frame.to_excel(writer, sheet_name=sheet_name, index=False)
else:
print("Sheet '01流水-去重' not found in the Excel file.")
上述代码由阿里云lingma完成。
功能:将one.xlsx文件中表two中第1列第2行至1000行的数据进行去重,并将结果保存到two-uni表格,如果two-uni已存在,则删除原表格。
需要:我们可以使用pandas库来处理Excel文件。
pip install pandas openpyxl

浙公网安备 33010602011771号