摘要:
1 python基础之模块 collections模块 collections是Python内建的一个集合模块,提供了许多有用的集合类。 namedtuple from collections import namedtuple Point = namedtuple('Point', ['x', ' 阅读全文
posted @ 2018-04-06 21:29
moonok
阅读(165)
评论(0)
推荐(0)
摘要:
PDF解析与结构化提取 PDF解析 对于PDF文档,我们选择用PDFMiner对其进行解析,得到文本。 PDFMiner PDFMiner使用了一种称作lazy parsing的策略,只在需要的时候才去解析,以减少时间和内存的使用。要解析PDF至少需要两个类:PDFParser 和 PDFDocum 阅读全文
posted @ 2018-04-06 21:21
moonok
阅读(4018)
评论(0)
推荐(0)