解决百度飞桨，Paddlex文本检测、文本识别模型-训练+评估BUG。

解决百度飞桨，Paddlex文本检测、文本识别模型-训练+评估BUG

问题：训练或评估，产生GBK问题，详细错误如下：

UnicodeDecodeError: 'gbk' codec can't decode byte 0x8f in position 20: illegal multibyte sequence

博主当前环境为：Win11、conda、Python=3.10、PaddlePaddle=3.0.0、PaddleX源码=3.0.0开发工具采用PyCharm.

修复过程：
1、命令读取的是yaml文件，找到yaml文件发现是UTF-8，将其修改为GBK，未解决。
2、用AI问了下发现是paddlex项目有问题。所以目前修改都是基于这个方法进行修改。

需要修改的文件所在位置为：PaddleX\paddlex\repo_apis\base\runner.py
修改前代码：
line = line.decode(_ENCODING)  # 原代码（约第 297 行）

修改后代码：
try:
    line = line.decode('utf-8')
except UnicodeDecodeError:
    try:
        line = line.decode('gbk')
    except UnicodeDecodeError:
        line = line.decode('utf-8', errors='ignore')

posted on 2025-07-11 10:12 SophieRoyal 阅读(153) 评论(0) 收藏举报

刷新页面返回顶部

解决百度飞桨，Paddlex文本检测、文本识别模型-训练+评估BUG。

解决百度飞桨，Paddlex文本检测、文本识别模型-训练+评估BUG

问题：训练或评估，产生GBK问题，详细错误如下：

导航

公告