定位和删除重复

1 import  pandas
2 excel=pandas.read_excel('成绩.xlsx',sheet_name='Sheet1')
3 #excel.drop_duplicates(subset='name',inplace=True,keep='last')  #keep默认为First,指保留第一个重复数据
4 
5 dup=excel.duplicated(subset='name')
6 print(dup.any())   #判断是否有重复数据
7 
8 dup=dup[dup]
9 print(excel.iloc[dup.index])  #打印出所有重复的值

 

posted @ 2020-06-13 11:32  马蹄哒哒  阅读(185)  评论(0编辑  收藏  举报