会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Believe in yourself.
eastonliu
记录测试路上的点点滴滴~
博客园
首页
新随笔
联系
订阅
管理
2018年11月4日
python爬取智联招聘职位信息(多进程)
摘要: 测试了下,采用单进程爬取5000条数据大概需要22分钟,速度太慢了点。我们把脚本改进下,采用多进程。 首先获取所有要爬取的URL,在这里不建议使用集合,字典或列表的数据类型来保存这些URL,因为数据量太大,太消耗内存,这里,python的生成器就发挥作用了。 在使用多进程之前,有两个问题需要解决:
阅读全文
posted @ 2018-11-04 15:24 eastonliu
阅读(1131)
评论(0)
推荐(0)
编辑
公告