摘要:        
from io import open import os def file_name(file_dir): """ 获取某文件夹下,特定扩展名的文件名, 返回特定扩展名文件列表 """ L=[] for root, dirs, files in os.walk(file_dir): for fil    阅读全文
posted @ 2021-02-01 00:31 季枫 阅读(649) 评论(0) 推荐(0)
| 
摘要:        
from io import open import os def file_name(file_dir): """ 获取某文件夹下,特定扩展名的文件名, 返回特定扩展名文件列表 """ L=[] for root, dirs, files in os.walk(file_dir): for fil    阅读全文
 posted @ 2021-02-01 00:31 季枫 阅读(649) 评论(0) 推荐(0) 
摘要:        
1、pdf阅读器adobe acrobat DC v2019 008 20074 可以识别pdf书中的文字(图片上选择区域右键选复制,软件会自动ocr) 把pdf 每一页导出为图片 2、Tesseract-OCR 把图片识别为文本文件,google的开源项目 tesseract "F:\pdfTot    阅读全文
 posted @ 2021-02-01 00:26 季枫 阅读(418) 评论(0) 推荐(0) | ||