摘要: pdf 是个异常坑爹的东西,有很多处理 pdf 的库,但是没有完美的。 一、pdfminer3k pdfminer3k 是 pdfminer 的 python3 版本,主要用于读取 pdf 中的文本。 网上有很多 pdfminer3k 的代码示例,看过以后,只想吐槽一下,太复杂了,有违 python 阅读全文
posted @ 2020-12-10 17:02 一颗桃子t 阅读(1670) 评论(0) 推荐(0)
摘要: 读取: 一、CSV格式: csv是Comma-Separated Values的缩写,是用文本文件形式储存的表格数据。 1.csv模块&reader方法读取: import csvwith open('enrollments.csv', 'rb') as f: reader = csv.reader 阅读全文
posted @ 2020-12-10 17:00 一颗桃子t 阅读(946) 评论(0) 推荐(0)
摘要: python是一门很强大的语言,因为有着丰富的第三方库,所以可以说Python是无所不能的。 很多人都知道,Python可以操作Excel,PDF·还有PPT,这篇文章就围绕Python提取PPT中的文字来写,包括提取PPT中的艺术字,图片中的文字。 因为实现环境是linux,所以无法用win32c 阅读全文
posted @ 2020-12-10 16:34 一颗桃子t 阅读(1261) 评论(0) 推荐(0)