解决百度飞桨,Paddlex文本检测、文本识别模型-训练+评估BUG。
解决百度飞桨,Paddlex文本检测、文本识别模型-训练+评估BUG
问题:训练或评估,产生GBK问题,详细错误如下:
UnicodeDecodeError: 'gbk' codec can't decode byte 0x8f in position 20: illegal multibyte sequence
博主当前环境为:Win11、conda、Python=3.10、PaddlePaddle=3.0.0、PaddleX源码=3.0.0开发工具采用PyCharm.
修复过程:
1、命令读取的是yaml文件,找到yaml文件发现是UTF-8,将其修改为GBK,未解决。
2、用AI问了下发现是paddlex项目有问题。所以目前修改都是基于这个方法进行修改。
需要修改的文件所在位置为:PaddleX\paddlex\repo_apis\base\runner.py修改前代码: line = line.decode(_ENCODING) # 原代码(约第 297 行) 修改后代码: try: line = line.decode('utf-8') except UnicodeDecodeError: try: line = line.decode('gbk') except UnicodeDecodeError: line = line.decode('utf-8', errors='ignore')
posted on 2025-07-11 10:12 SophieRoyal 阅读(70) 评论(0) 收藏 举报
浙公网安备 33010602011771号