pandas去除重复的列

Pandas提供了duplicated、Index.duplicated、drop_duplicates函数来标记及删除重复记录。

duplicated函数用于标记Series中的值、DataFrame中的记录行是否是重复，重复为True，不重复为False。

函数定义：

其中参数解释如下：

若index有相同的

d = df[~df.index.duplicated(keep='last')]
keep可取 first，last. first指保留第一个值，last则保留最后一个值。

posted @ 2022-06-21 09:40 c++11 阅读(1658) 评论(0) 收藏举报

刷新页面返回顶部

c++life