摘要:
这段代码是一个基于 PaddleOCR 和 PaddleOCR-VL 模型的 PDF 文档处理脚本,能够提取 PDF 文档中的文本和图片,并根据指定的任务(如 OCR、表格、公式、图表识别)进行进一步处理。处理完成后,可以将结果以结构化的格式(JSON 或 Markdown)输出。下面我将详细讲解这 阅读全文
posted @ 2025-11-28 11:18
学java的阿驴
阅读(71)
评论(0)
推荐(0)
浙公网安备 33010602011771号