摘要: # 多线程与多进程 ## 一, 什么是进程, 什么是线程? ​ 进程: 运行中的程序. 每次我们执行一个程序, 咱们的操作系统对自动的为这个程序准备一些必要的资源(例如, 分配内存, 创建一个能够执行的线程. ) ​ 线程: 程序内, 可以直接被CPU调度的执行过程. 是操作系统能够进行运算调度的最 阅读全文
posted @ 2023-06-09 16:35 STONEEEEE 阅读(50) 评论(0) 推荐(0)
摘要: # 数据请求 > 爬虫的数据请求通常是应用于抓取页面源代码,请求方式可以通过python内置模块urllib模块来获得页面源代码,但是这种方式并不常用。 > > request模块是一种第三方模块,通常采用这个模块来抓取页面源代码,该模块比urllib要简单,且处理各种请求方式也比较方便 ## 模块 阅读全文
posted @ 2023-06-08 23:56 STONEEEEE 阅读(54) 评论(0) 推荐(0)
摘要: ## 浏览器工具 ## web请求过程 ## http协议 ## 数据解析 > 目的提取有效的数据信息 四种解析方式 1. re解析:正则表达式解析,效率特别高 2. bs4解析:老项目的解析方式 3. xpath解析:高级,简单方便速度快 4. pyquery解析:模仿前端的jQuery函数库的解 阅读全文
posted @ 2023-06-08 22:56 STONEEEEE 阅读(23) 评论(0) 推荐(0)