飞桨的PP-StructureV3产线解析全英文文档问题;PP-StructureV3的多产线问题;
1.飞桨的PP-StructureV3产线解析全英文文档问题
PP-StructureV3 产线使用的默认文本识别模型为中英文识别模型,
👉对于纯英文的识别能力有限,对于全英文场景,设置为text_recognition_model_name参数为 en_PP-OCRv4_mobile_rec。
👉由于目前论文的识别需求中包含有全英文的文档,尝试测试en_PP-OCRv4_mobile_rec与PP-OCRv5_server_rec的性能表现。
直接下载en_PP-OCRv4_mobile_rec,上传至GPU服务器,修改当前StructureV3产线配置YAML文件:
GeneralOCR:
TextRecognition:
batch_size: 8
model_dir: paddle_models/en_PP-OCRv4_mobile_rec # 修改为全英文识别模型
model_name: en_PP-OCRv4_mobile_rec
module_name: text_recognition
score_thresh: 0.1
测试了全英文论文,英文识别模型(en_PP-OCRv4_mobile_rec)识别效果确实比原默认的中英文识别模型(PP-OCRv5_server_rec)好;
但对于中英混合文档以及中文文档效果较差。
👉现在产生了新的另一个问题,如果我要使用英文识别模型,需要额外布置一条PP-StructureV3产线,占用大量显存资源?
2.PP-StructureV3的多产线问题;
浙公网安备 33010602011771号