pandas/mysql/excel 中关于去除重复数据记录的总结

1.Excel中如果需要根据多个条件(字段)去除重复记录时:

直接依次对每个字段进行排序,然后按照指定的字段筛选即可。

 

2.在mysql中根据多个条件排序后去除重复记录的语句:

注意:月销量(件) 和 月份  ,两个条件时有先后顺序的,对应在excel中先后对两个字段进行降序排列,然后删除重复值

 

 

3.在pandas中对应的操作用下面的语句代替:

也是因为对两个字段执行的都是降序操作,所以可以放在一起,依然有先后顺序。去重时,保留第一条记录,后边的重复记录删除。

在mysql中通过group by取得的也是第一条记录。

在excel中执行去重操作,保留下来的也是第一条记录。

 

posted @ 2021-07-21 18:09  sauron2021  阅读(460)  评论(0编辑  收藏  举报