解决百度飞桨,Paddlex文本检测、文本识别模型-训练+评估BUG。

解决百度飞桨,Paddlex文本检测、文本识别模型-训练+评估BUG

问题:训练或评估,产生GBK问题,详细错误如下:

UnicodeDecodeError: 'gbk' codec can't decode byte 0x8f in position 20: illegal multibyte sequence


博主当前环境为:Win11、conda、Python=3.10、PaddlePaddle=3.0.0、PaddleX源码=3.0.0开发工具采用PyCharm.


修复过程:
    1、命令读取的是yaml文件,找到yaml文件发现是UTF-8,将其修改为GBK,未解决。
    2、用AI问了下发现是paddlex项目有问题。所以目前修改都是基于这个方法进行修改。


需要修改的文件所在位置为:PaddleX\paddlex\repo_apis\base\runner.py

修改前代码:
line = line.decode(_ENCODING)  # 原代码(约第 297 行)

修改后代码:
try:
    line = line.decode('utf-8')
except UnicodeDecodeError:
    try:
        line = line.decode('gbk')
    except UnicodeDecodeError:
        line = line.decode('utf-8', errors='ignore')

posted on 2025-07-11 10:12  SophieRoyal  阅读(70)  评论(0)    收藏  举报

导航