pypdfium2 PDFium 的python 包装

pypdfium2 是对于PDFium的python 包装,官方说明处理任务性能可以接近PyMuPDF

说明

pypdfium2 内部基于了ctypesgen 包装(相比原始进行了自己的扩展),生成python 绑定的代码,这样可以进行快速的代码处理,我在测试提取一个14m的pdf 文本内容花了不到3s,同时将每页转换为图片花了80多s(818页),整体性能还是很不错的,值得尝试下

参考资料

https://github.com/pypdfium2-team/pypdfium2

https://github.com/pypdfium2-team/ctypesgen

https://github.com/pymupdf/PyMuPDF

https://github.com/pdfminer/pdfminer.six

https://github.com/jsvine/pdfplumber

posted on 2025-10-14 08:00  荣锋亮  阅读(10)  评论(0)    收藏  举报

导航