Scrapy简介

一、架构图

二、流程

1、引擎从调度器中取出一个URL,用于抓取

2、引擎把URL封装成一个请求(start_requests) 传递给下载器

3、下载器把资源下载下来,并封装成Response

4、爬虫解析(parse) Response

5、解析出实体(yield Item),交给pipelines中的process_item方法

6、解析出URL(yield Resquest),则把URL交给调度器等待抓取

 

posted @ 2019-10-27 23:25  市丸银  阅读(136)  评论(0编辑  收藏  举报