爬虫开发进阶

性能强大的爬虫框架Scrapy

https://www.cnblogs.com/eailoo/articles/9897053.html

之前我们已经启动了一个Scrapy框架，由于反扒机制，我们在Scrapy框架中如何使用代理呢？

提问：如果想要通过爬虫程序去爬取”糗百“全站数据新闻数据的话，有几种实现方法？

方法一：基于Scrapy框架中的Spider的递归爬取进行实现（Request模块递归回调parse方法）。

方法二：基于CrawlSpider的自动爬取进行实现（更加简洁和高效）。

https://www.cnblogs.com/eailoo/articles/9897958.html

posted @ 2018-11-02 19:08 eailoo 阅读(67) 评论(0) 收藏举报

刷新页面返回顶部