文章分类 -  爬虫系列

摘要:// <![CDATA[ MathJax.Hub.Config({ tex2jax: { inlineMath: [ ['$','$'], ["\\(","\\)"] ], displayMath: [ ['$$','$$'], ["\\[","\\]"] ], processEscapes: tr 阅读全文
posted @ 2019-05-27 19:22 梭梭666 阅读(355) 评论(0) 推荐(0)
摘要:基于 Scrapy-redis 两种形式的分布式爬虫 redis 分布式部署 1、scrapy 框架是否可以自己实现分布式? 答:不可以,原因有二: 其一: 因为多台机器上部署的 Scrapy 会各自拥有各自的调度器,这样就使得多台机器无法分配 start_url 列表中的url, (多台机器无法共 阅读全文
posted @ 2019-05-27 17:35 梭梭666 阅读(148) 评论(0) 推荐(0)
摘要:reuqests_test In [2]: import requests In [ ]: # 爬取 一张图片, 并做持久化保存 import requests url = 'https://ss1.bdstatic.com/70cFvXSh_Q1YnxGkpoWK1HF6hhy/it/u=2381 阅读全文
posted @ 2019-05-19 17:42 梭梭666 阅读(110) 评论(0) 推荐(0)

返回顶部