判断pdf文件是否正常可用

之前在下载港交所的文件的时候会碰到有些文件异常的情况,文件下载下来,但是不能打开。查到其他的方法不是判断错误就是很麻烦。
 
整理出一个非常简单的方法,将文件以二进制方式打开,然后判断文件的开头是否符合pdf标准:
处理我这个情况非常好用,不一定适用于所有情况
python实现:
def is_pdf_by_path(path):
    with open(path, "rb") as f:
        data = f.read()
        if data and data.startswith(rb"%PDF-1."):
            return True
        return False


if __name__ == "__main__":
    print(is_pdf_by_path("/Users/jack/Desktop/1.pdf"))

 

其中还可以对结尾进行判断,参考链接:https://stackoverflow.com/questions/941813/how-can-i-determine-if-a-file-is-a-pdf-file

 

# 若果觉得有帮助,可以点个推荐,以便传播

posted @ 2019-10-15 14:23  Jacck  阅读(1531)  评论(0编辑  收藏  举报