摘要: 1、爬取某网站内容时,返回的结果为乱码,如图: 2、写在前面的解释 Requests会基于HTTP头部响应的编码做出有根据的推测,当访问r.text时,Requests会使用其推测的文本编码。 查看网页返回的字符集类型:r.apparent_encoding 查看自动判断的字符集类型:r.encod 阅读全文
posted @ 2022-03-11 13:59 simon_T 阅读(3192) 评论(0) 推荐(0)
摘要: ###bs4数据解析的原理: - 1.实例化一个BeautifulSoup对象,并且将页面源码数据加载到该对象中 - 2.通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取 - 环境安装: - pip install bs4 - pip install lxml - 如 阅读全文
posted @ 2022-03-11 12:57 simon_T 阅读(349) 评论(0) 推荐(0)