07 2025 档案
摘要:在RAG应用中通常需要对各种文档进行文本提取,如果稳定是纯文本那文档提取会简单很多,但通常文档中会存在各种图片信息,这是就需要使用OCR在提取文档文本信息的同时对图片进行OCR获取图片中的文本内容。本文只介绍PDF文档中OCR技术方案。PDF文档解析目前有不少开源框架亦可支持对PDF中的图片进行OC
阅读全文
摘要:在智能体爆发的浪潮中,信息的获取与处理效率无论是对企业亦或是个人都是保持竞争力的关键。面对日益分散和爆炸式增长的信息源,常常极易使人沉迷其中,陷入碎片化消耗陷阱,时间萧然流失。本文将深度剖析一个智能体的构建的全自动 AI 资讯简报智能体,从架构设计、技术实现和应用价值三个层面,揭示如何打造一个可扩展
阅读全文
浙公网安备 33010602011771号