摘要: 从爬取一页数据到爬取所有数据 先说一下静态网页爬虫的大概流程 数据加载方式 通过点击第二页发现,网站后面多了 ?start=25 字段 这部分被称为 查询字符串,查询字符串作为用于搜索的参数或处理的数据传送给服务器处理,格式是 ?key1=value1&key2=value2。 我们多翻几页豆瓣读书 阅读全文
posted @ 2022-03-06 15:01 Vowzhou 阅读(1561) 评论(0) 推荐(0) 编辑
摘要: 解析数据 通过在命令行中输入 pip install beautifulsoup4 安装 BeautifulSoup 我们通过 from bs4 import BeautifulSoup 语句导入 BeautifulSoup,然后使用 BeautifulSoup(res.text, 'html.pa 阅读全文
posted @ 2022-03-06 11:03 Vowzhou 阅读(62) 评论(0) 推荐(0) 编辑