摘要: 这段代码是一个基于 PaddleOCR 和 PaddleOCR-VL 模型的 PDF 文档处理脚本,能够提取 PDF 文档中的文本和图片,并根据指定的任务(如 OCR、表格、公式、图表识别)进行进一步处理。处理完成后,可以将结果以结构化的格式(JSON 或 Markdown)输出。下面我将详细讲解这 阅读全文
posted @ 2025-11-28 11:18 学java的阿驴 阅读(71) 评论(0) 推荐(0)