BeautifulSoup获取网页为乱码的解决
1、扒取网页
req = requests.get(url = target) html = req.text bf = BeautifulSoup(html,'html.parser') texts = bf.find_all('a') print(texts)
2、输出结果
3、F12查看原页面
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
4、估计是默认使用的编码不对,页面内容取回后先指定解码方式,试试。
代码:
req = requests.get(url = target) req.encoding='utf-8' #指定编码格式,解决中文乱码显示 html = req.text bf = BeautifulSoup(html,'html.parser') texts = bf.find_all('a') print(texts)
结果:
5、问题解决