飞桨的PP-StructureV3产线解析全英文文档问题；PP-StructureV3的多产线问题；

1.飞桨的PP-StructureV3产线解析全英文文档问题
PP-StructureV3 产线使用的默认文本识别模型为中英文识别模型，
👉对于纯英文的识别能力有限，对于全英文场景，设置为text_recognition_model_name参数为 en_PP-OCRv4_mobile_rec。
👉由于目前论文的识别需求中包含有全英文的文档，尝试测试en_PP-OCRv4_mobile_rec与PP-OCRv5_server_rec的性能表现。

直接下载en_PP-OCRv4_mobile_rec，上传至GPU服务器，修改当前StructureV3产线配置YAML文件：

GeneralOCR:
      TextRecognition:
        batch_size: 8
        model_dir: paddle_models/en_PP-OCRv4_mobile_rec # 修改为全英文识别模型
        model_name: en_PP-OCRv4_mobile_rec
        module_name: text_recognition
        score_thresh: 0.1

测试了全英文论文，英文识别模型（en_PP-OCRv4_mobile_rec）识别效果确实比原默认的中英文识别模型（PP-OCRv5_server_rec）好；
但对于中英混合文档以及中文文档效果较差。

👉现在产生了新的另一个问题，如果我要使用英文识别模型，需要额外布置一条PP-StructureV3产线，占用大量显存资源？

2.PP-StructureV3的多产线问题；

posted @ 2026-01-24 09:21 asphyxiasea 阅读(1) 评论(0) 收藏举报

刷新页面返回顶部

飞桨的PP-StructureV3产线解析全英文文档问题；PP-StructureV3的多产线问题；

公告