会员
众包
新闻
博问
闪存
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
石头木
乾坤未定一切皆有可能
博客园
首页
新随笔
联系
订阅
管理
2022年11月4日
利用ocr将pdf转为docx
摘要: 利用ocr将pdf转为docx 项目地址:https://github.com/jiangnanboy/pdf_to_docx 背景 该项目首先将pdf文件转为图片形式,再使用百度的paddleocr对这些图片文件分别进行识别,利用PPStructure对识别的内容进行结构化,最终将结构化的内容保存
阅读全文
posted @ 2022-11-04 21:23 石头木
阅读(553)
评论(0)
推荐(0)
编辑
公告