摘要: 当使用scrapy爬取的数据不在同一张页面中(一次请求与数据后解析无法获得想要的全部数据),需要请求传参,在第一次解析时实例化item,将item传递,再次将请求到的数据解析后,封装在item中。 关键点 例如在豆瓣中,电影封面页获取电影名称,在详情页获取电影简介: ​ 先从起始网页解析出电影名称和 阅读全文
posted @ 2019-10-08 19:50 Sroxi 阅读(308) 评论(0) 推荐(0)
摘要: scrapy简介 ​ Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中 scrapy的执行流程 Scrapy主要包括了以下组件: 引擎(Scrapy): 用来处理整个系统的数据流处理, 触发事务(框架核心) 调度器( 阅读全文
posted @ 2019-10-08 17:51 Sroxi 阅读(475) 评论(0) 推荐(0)
摘要: 一、设置与编写 打开cmd,选择好路径 1.创建项目 2.生成模板 d:\爬虫\11.scrapy\testproject python coding: utf 8 import scrapy class TestspiderSpider(scrapy.Spider): name = 'testsp 阅读全文
posted @ 2019-10-08 09:40 Sroxi 阅读(194) 评论(0) 推荐(0)