urllib编码问题踩坑

今天在使用python的urllib对网页进行爬取的时候，中文一直出现错误

UnicodeEncodeError: 'ascii' codec can't encode character '\u6211' in position 26: ordinal not in range(128)

我一直以为是我的编辑器编码问题，因为显示是ascii编码问题，结果转换了很多次后还是没用，终于查资料发现，urllib本身就是使用ascii进行编码的，如果是中文的话，需要对中文进行单独编码，也就是使用，对中文进行编码，再拼接到url中，然后就可以正常访问了

urllib.parse.quote(“中文”)

posted @ 2022-11-11 17:17 B站读研阅读(47) 评论(0) 收藏举报

刷新页面返回顶部