PPStructureV3包含了很多模型包括PP-OCRv5;paddle模型二次开发;
1.PPStructureV3包含了很多模型包括PP-OCRv5
PDF / 图片 → 页面结构 → 区域语义 → OCR / 表格 / 印章 → 可用文本或结构化结果
👉 PP-Structure ≠ OCR
👉 它是一个多模型调度系统
PP-Structure V3 的整体流水线(非常重要)
输入(PDF / 图片)
↓
文档方向分类(Doc Orientation)
↓
页面扭曲矫正(Unwarping,可选)
↓
版面分析(Layout Detection)
↓
┌──────────┬──────────┬───────────┐
│ 文本区域 │ 表格区域 │ 印章/图表 │
└──────────┴──────────┴───────────┘
↓
OCR / 表格识别 / 印章识别
↓
Markdown / HTML / JSON
浙公网安备 33010602011771号