2022 年 3月 11 日随笔档案 - simon_T

2022年3月11日

摘要： 1、爬取某网站内容时，返回的结果为乱码，如图： 2、写在前面的解释 Requests会基于HTTP头部响应的编码做出有根据的推测，当访问r.text时，Requests会使用其推测的文本编码。查看网页返回的字符集类型：r.apparent_encoding 查看自动判断的字符集类型：r.encod 阅读全文

posted @ 2022-03-11 13:59 simon_T 阅读(3201) 评论(0) 推荐(0)

python爬虫学习（五）：bs4数据解析-爬取小说

摘要： ###bs4数据解析的原理： - 1.实例化一个BeautifulSoup对象，并且将页面源码数据加载到该对象中 - 2.通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取 - 环境安装： - pip install bs4 - pip install lxml - 如阅读全文

posted @ 2022-03-11 12:57 simon_T 阅读(359) 评论(0) 推荐(0)

simon成长日记

有缘相见万里来，志气相投常相见！

公告