会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
每天都想喝咖啡
博客园
首页
新随笔
联系
订阅
管理
随笔分类 -
PDF解析
包括票据,合同等PDF文件解析
pdfplumber解析PDF报错:ValueError: not enough values to unpack (expected 2, got 1)
摘要:问题: 环境:Ubuntu18.04,电子发票PDF文档 原因:未明确问题原因,只能确定是pdfminer针对中文字体重新编译安装后才该错误(如果有大神知道望告知) 解决:修改源码,其实就是做了一层错误过滤
阅读全文
posted @
2021-11-05 11:18
大咖妈妈
阅读(364)
评论(0)
推荐(0)
pdfplumber解析票据PDF文档,部分中文字体返回CID,无法解析
摘要:问题:部分汉字字体无法解析,出现CID代号 环境:Ubuntu18.04,PDF文件内容必须为文字,图片不支持文字解析(Linux可以打开PDF文件右键,如果有复制图像选项,则该PDF文件内容为图像) 解决:pdfminer需要重新重新编译一下,官方文档首页有提示,针对CJK字体的支持 python
阅读全文
posted @
2021-11-05 11:03
大咖妈妈
阅读(2111)
评论(0)
推荐(0)
公告