摘要:
# 数据请求 > 爬虫的数据请求通常是应用于抓取页面源代码,请求方式可以通过python内置模块urllib模块来获得页面源代码,但是这种方式并不常用。 > > request模块是一种第三方模块,通常采用这个模块来抓取页面源代码,该模块比urllib要简单,且处理各种请求方式也比较方便 ## 模块 阅读全文
posted @ 2023-06-08 23:56
STONEEEEE
阅读(54)
评论(0)
推荐(0)
摘要:
## 浏览器工具 ## web请求过程 ## http协议 ## 数据解析 > 目的提取有效的数据信息 四种解析方式 1. re解析:正则表达式解析,效率特别高 2. bs4解析:老项目的解析方式 3. xpath解析:高级,简单方便速度快 4. pyquery解析:模仿前端的jQuery函数库的解 阅读全文
posted @ 2023-06-08 22:56
STONEEEEE
阅读(23)
评论(0)
推荐(0)

浙公网安备 33010602011771号