Python删除相同的重复文件

import hashlib, os


# 获取文件的md5 的函数
def getMD5(filepath):
    f = open(filepath, 'rb')
    md5bj = hashlib.md5()  # 获取一个md5 加密对象
    md5bj.update(f.read())  # 指定加密的信息
    hah = md5bj.hexdigest()  # 获取加密后的 16 进制字符串

    f.close()
    return str(hah).upper()


path_cwd = os.getcwd()
path = r'C:\Desktop\qwe'  # 指定删除要处理的文件
file_list = os.listdir(path)
file_md5 = []

for filename in file_list:
    md5val = getMD5(os.path.join(path_cwd, path, filename))
    if md5val in file_md5:
        os.remove(os.path.join(path_cwd, path, filename))
        print('%s已经删除' % filename)
    else:
        file_md5.append(md5val)

print("...相同文件已删除...")

 

posted @ 2022-08-15 11:29  羔羊也有梦想  阅读(100)  评论(0)    收藏  举报