“Python中,打印字符串时,字符串本身的编码,与输出终端中所用编码不匹配”
此处不再赘述,只简要再说一下:
如果你本身拿到的是utf-8等,非gbk编码的字符串,然后用print去打印出来
在windows系统就是输出到cmd中
而cmd中,(对于多数中国人所用的是中文的系统)默认字符编码是gbk
从而导致此种现象:
python要将utf-8编码的字符串,在gbk的cmd的中打印出来
所以先要去尝试,用gbk的编码,解码为Unicode然后再打印出来
结果就出现此处的错误了。
详细解释,还是参见上面的教程。
其中还有示例代码的。
(3)处理的字符的确是gbk的,但是其中夹杂的部分特殊字符,是gbk编码中所没有的
如果有些特殊字符是GB18030中有的,但是是gbk中没有的。
则用gbk去解码,去所不支持的字符,也比如会出错。
所以,此种情况,可以尝试用和当前编码(gbk)所兼容的但所包含字符更多的编码(gb18030)去解码,或许就可以了。