找出一组数据中重复数据

使用pandas

    df = pd.read_csv(file_path, sep='\t', header=None)
    a = df.drop_duplicates(subset=[0], keep='first')
    b = df.drop_duplicates(subset=[0], keep=False)
    f = a.append(b).drop_duplicates(subset=[0], keep=False)

其中,f就是重复数据的DateFtrame,之后便可以使用了

posted @ 2020-10-23 16:05  今夜无风  阅读(213)  评论(0编辑  收藏  举报