PPStructureV3包含了很多模型包括PP-OCRv5;paddle模型二次开发;

1.PPStructureV3包含了很多模型包括PP-OCRv5
PDF / 图片 → 页面结构 → 区域语义 → OCR / 表格 / 印章 → 可用文本或结构化结果
👉 PP-Structure ≠ OCR
👉 它是一个多模型调度系统
PP-Structure V3 的整体流水线(非常重要)

输入(PDF / 图片)
   ↓
文档方向分类(Doc Orientation)
   ↓
页面扭曲矫正(Unwarping,可选)
   ↓
版面分析(Layout Detection)
   ↓
┌──────────┬──────────┬───────────┐
│ 文本区域 │ 表格区域 │ 印章/图表 │
└──────────┴──────────┴───────────┘
   ↓
OCR / 表格识别 / 印章识别
   ↓
Markdown / HTML / JSON
posted @ 2026-01-23 11:52  asphyxiasea  阅读(3)  评论(0)    收藏  举报