摘要:
from io import open import os def file_name(file_dir): """ 获取某文件夹下,特定扩展名的文件名, 返回特定扩展名文件列表 """ L=[] for root, dirs, files in os.walk(file_dir): for fil 阅读全文
posted @ 2021-02-01 00:31 季枫 阅读(652) 评论(0) 推荐(0)
|
摘要:
from io import open import os def file_name(file_dir): """ 获取某文件夹下,特定扩展名的文件名, 返回特定扩展名文件列表 """ L=[] for root, dirs, files in os.walk(file_dir): for fil 阅读全文
posted @ 2021-02-01 00:31 季枫 阅读(652) 评论(0) 推荐(0)
摘要:
1、pdf阅读器adobe acrobat DC v2019 008 20074 可以识别pdf书中的文字(图片上选择区域右键选复制,软件会自动ocr) 把pdf 每一页导出为图片 2、Tesseract-OCR 把图片识别为文本文件,google的开源项目 tesseract "F:\pdfTot 阅读全文
posted @ 2021-02-01 00:26 季枫 阅读(428) 评论(0) 推荐(0) |
||