python开发简易pdf阅读器,没开发,换个思路:pdf转word文档

---初学python---

 

最近发现电脑里的pdf文件用浏览器全都打不开了,所以想到最近新学了python,为何不自己做一个呢?

准备环境:

  • Python3.7

  • PyMuPDF

  • PyQt5

首先安装 PyMuPDF 来解析 PDF ,如图:

 

安装PyQt5 ,做视图操作文件:

 阅读器还没做,哈哈哈,但是最近想着直接转换成word文档不就好了吗,哈哈哈,就几行代码,如下:

from pdfminer.high_level import extract_pages
from pdfminer.layout import LTTextContainer
from docx import Document

#先创建doc对象
doc = Document()  # 以默认模板建立文档对象
#将pdf内容转换成文字
for page_layout in extract_pages("test.pdf"):
    for element in page_layout:
        if isinstance(element, LTTextContainer):
            print(element.get_text())
            #写入内容
            paragraph = doc.add_paragraph(element.get_text())
    #最关键的一步,保存文档
    doc.save('test.docx')

 

 

 

 

 

 

 

 

 



 

posted @ 2020-09-25 13:45  猫着鱼  阅读(668)  评论(0编辑  收藏  举报