2018 年 1月 11 日随笔档案 - 晋好林

2018年1月11日

摘要：今天遇到一个批量读取pdf文件中表格数据的需求，样式大体是以下这样： python读取PDF无非就是三种方式（我所了解的），、``pdf2htmlEX Tabula``。综合考虑后，选择了最后一种。下面对三种方式分别介绍： pdfminer 该方式从网上搜索的结果是，可以提取pdf文本数据，但是提阅读全文

posted @ 2018-01-11 14:29 晋好林阅读(45500) 评论(8) 推荐(8) 编辑

晋好林

成长是不断重构自己的过程

公告