04 2022 档案
摘要:高性能异步爬虫目的:在爬虫中使用异步实现高性能的数据爬取操作 异步爬虫的方式:1、多线程,多进程(不建议): -好处:可以为相关阻塞的操作单独开启线程或者进程,阻塞操作就可以异步执行 -弊端:无法限制的开启多线程或者进程 2、线程池、进程池: -好处:我们可以降低系统对进程或者线程创建和销毁的一个频
阅读全文
摘要:编码流程:--指定url--发起请求--获取响应数据--数据解析--持久化存储 数据解析的原理概述:解析的局部的文本内容都会在标签之间或者标签对应的属性中进行存储1、进行指定的标签的定位2、标签或者标签对应的属性中存储的数据值进行提取(解析) 数据解析分类:re解析bs4解析xpath解析 impo
阅读全文

浙公网安备 33010602011771号