摘要:【提要】win平台上,python2.7官网的安装包在安装后不会添加环境变量且不会把安装信息写入注册表。 把python和pip的安装路径添加到环境变量是做python开发必要的一步,而写入注册表的原因是,有些python包以 windows installer的形式安装,安装的时候需要用到pyth
阅读全文
摘要:我们接触到的很多文档资料都是以pdf格式存在的,比如:论文,技术文档,标准文件,书籍等。pdf格式使得用机器从中提取信息格外困难。 为了解决这个问题,我找到了几种解决方案,最后选择了python上的pdfplumber库,安装和使用都相对比较方便,效果也还不错,所以下面介绍这个库的安装与使用。 安装
阅读全文
摘要:1 import pdfplumber 2 3 with pdfplumber.open('test.pdf') as pdf: 4 #page_count = len(pdf.pages()) 5 p0 = pdf.pages[0] 6 # 获取文本,直接得到字符串,包括了换行符【与PDF上的换行位置一致,而不是实际的“段落”】 7 #print...
阅读全文
摘要:1 # -*- coding: utf-8 -*- 2 import xlsxwriter 3 4 workbook = xlsxwriter.Workbook('test.xlsx') 5 worksheet = workbook.add_worksheet("test") 6 worksheet.set_column("A:A", 40) #设置列宽度 7 worksh...
阅读全文