【Python】查找和删除表格中的重复行
查找:
import pandas as pd df = pd.read_excel("秘籍.xlsx") #打开 list1 = [] for i in range(df.shape[0]): #总行数 list1.append(list(df.values[i])) #将每行以列表的形式装入列表 for x in list1: if list1.count(x)>1: #如果列表中元素出现次数 >1 print(x) #打印该行
print(list1.count(x)) #打印重复次数
删除:
import pandas as pd df = pd.read_excel("秘籍.xlsx",sheet_name='Sheet3') #打开 df2 = df.drop_duplicates() #去掉重复行 df2.to_excel("【去重】秘籍.xlsx",index=False) #保存