【Python】PDF拆分、合并及其转换

1.拆分

#import sys
#sys.path.append(r"c:\users\lenovo\appdata\local\programs\python\python312\lib\site-packages")  #这里包的安装目录不同,将其加入系统变量,目录相同不需要这个
from PyPDF3 import PdfFileWriter, PdfFileReader
input_pdf = PdfFileReader(r"F:\需要拆分的PDF文件.pdf") #使用 PdfFileReader 读取原始文件
output = PdfFileWriter()
#output.addPage(input_pdf.getPage(4)) #第x页,使用 PdfFileWriter 的 addPage() 方法将 PDF 页面添加到新的 PDF 中并保存
#output.addPage(input_pdf.getPage(30)) #可以添加多个页面
for i in range(15,16):#拆分第15-16页,从0开始计数
    output.addPage(input_pdf.getPage(i))  # 第x页,使用 PdfFileWriter 的 addPage() 方法将 PDF 页面添加到新的 PDF 中并保存

with open(r"保存拆分后的PDF文件.pdf", "wb") as out:
    output.write(out)

2.合并

from PyPDF3 import PdfFileReader, PdfFileMerger
pdf_file1 = PdfFileReader(r"1.pdf") #第一页
pdf_file2 = PdfFileReader(r"2.pdf")#第二页
output = PdfFileMerger()
output.append(pdf_file1)
output.append(pdf_file2)
with open(r"3.pdf", "wb") as out:
    output.write(out)

 3.PDF转换成表格(扫描件不行)

#只能是转换的PDF,不能转换扫描件

import camelot

tables = camelot.read_pdf(r"需要转换的PDF文件.pdf",flavor='stream')

tables[0].to_csv(r"转化后存为csv表格.csv") #表格输出

 

posted @ 2025-01-15 10:41  山鬼谣`  阅读(50)  评论(0)    收藏  举报