摘要: scrapy 就是一个帮助爬取网站数据,帮助提取网站结构化数据的框架。 组件概览: Scheduler : Scrapy Engine: 引擎负责数据流在整个系统中的流动,也就是在你start 启动的那一瞬间,会有相应触发事件。 spiders: 爬虫程序, 里包括如何爬取网页,分析返回的respo 阅读全文
posted @ 2017-09-02 16:47 tonycloud 阅读(255) 评论(0) 推荐(0)