会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
soft
LxFly
相信技术会改变一切!
博客园
首页
新随笔
联系
订阅
管理
2025年7月23日
精准与效率:RAG应用PDF文档图文提取OCR策略
摘要: 在RAG应用中通常需要对各种文档进行文本提取,如果稳定是纯文本那文档提取会简单很多,但通常文档中会存在各种图片信息,这是就需要使用OCR在提取文档文本信息的同时对图片进行OCR获取图片中的文本内容。本文只介绍PDF文档中OCR技术方案。PDF文档解析目前有不少开源框架亦可支持对PDF中的图片进行OC
阅读全文
posted @ 2025-07-23 08:37 AiFly
阅读(164)
评论(0)
推荐(0)