分布式爬虫
摘要:
分布式爬虫 scrapy框架是否可以自己实现分布式? 不可以 多台机器上部署的scrapy会各自拥有自己的调度器,这样就使得多台机器无法分配start_url列表中的url。即:多台机器无法共享同一个调度器。 多台机器爬取到的数据无法通过同一个管道对数据进行统一的数据持久化储存。即:多台机器无法共享 阅读全文
posted @ 2019-04-06 12:12
透明的洪湖里
阅读(170)
评论(0)
推荐(0)
浙公网安备 33010602011771号