首页  :: 新随笔  :: 管理

2021年2月1日

摘要: from io import open import os def file_name(file_dir): """ 获取某文件夹下,特定扩展名的文件名, 返回特定扩展名文件列表 """ L=[] for root, dirs, files in os.walk(file_dir): for fil 阅读全文

posted @ 2021-02-01 00:31 季枫 阅读(605) 评论(0) 推荐(0) 编辑

摘要: 1、pdf阅读器adobe acrobat DC v2019 008 20074 可以识别pdf书中的文字(图片上选择区域右键选复制,软件会自动ocr) 把pdf 每一页导出为图片 2、Tesseract-OCR 把图片识别为文本文件,google的开源项目 tesseract "F:\pdfTot 阅读全文

posted @ 2021-02-01 00:26 季枫 阅读(389) 评论(0) 推荐(0) 编辑

智读 | 成都会领科技有限公司官网 | 智读App下载 | 每天听本书的博客 | |