随笔- 74  评论- 0  文章- 0 

python dataframe drop_duplicates用法技巧去重

1 data.drop_duplicates()#data中一行元素全部相同时才去除
2 data.drop_duplicates(['a','b'])#data根据’a','b'组合列删除重复项,默认保留第一个出现的值组合。传入参数keep='last'则保留最后一个
3 
4 data.drop_duplicates(['a','b'],keep='last')

 

posted on 2018-01-19 15:26  hailuo  阅读(26976)  评论(0编辑  收藏