关于字符编码
正在做web搜索技术的一个小作业,一个简单的爬虫。对中文的处理搞得我头都大了,utf-8,gbk,Unicode,还有解码与编码,概念混淆不清楚。贴上我认为讲的很好的博文,以后再有疑问可以慢慢学习。
UNICODE,GBK,UTF-8区别:
https://www.cnblogs.com/gavin-num1/p/5170247.html
字符集编码详解(学习,看一篇就够了):
字符编码详解:
https://www.crifan.com/files/doc/docbook/char_encoding/release/html/char_encoding.html
解决python3 UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX:

浙公网安备 33010602011771号