摘要: # 数据请求 > 爬虫的数据请求通常是应用于抓取页面源代码,请求方式可以通过python内置模块urllib模块来获得页面源代码,但是这种方式并不常用。 > > request模块是一种第三方模块,通常采用这个模块来抓取页面源代码,该模块比urllib要简单,且处理各种请求方式也比较方便 ## 模块 阅读全文
posted @ 2023-06-08 23:56 STONEEEEE 阅读(54) 评论(0) 推荐(0)
摘要: ## 浏览器工具 ## web请求过程 ## http协议 ## 数据解析 > 目的提取有效的数据信息 四种解析方式 1. re解析:正则表达式解析,效率特别高 2. bs4解析:老项目的解析方式 3. xpath解析:高级,简单方便速度快 4. pyquery解析:模仿前端的jQuery函数库的解 阅读全文
posted @ 2023-06-08 22:56 STONEEEEE 阅读(23) 评论(0) 推荐(0)