摘要:
scrapy下使用item才是正经方法。在item中定义需要保存的内容,然后在pipeline处理item,爬虫流程就成了这样: 抓取 --> 按item规则收集需要数据 -->使用pipeline处理(存储等) 定义item,在items.py中定义抓取内容 我们将数据库的配置信息保存在setti 阅读全文
posted @ 2018-09-25 14:47
brady-wang
阅读(609)
评论(0)
推荐(0)
摘要:
scrapy错误:yield scrapy.Request()不执行、失效、Filtered offsite request to错误。首先我们在Request()方法里面添加这么一个东东:yield Request(url, callback=self.parse_item, dont_filte 阅读全文
posted @ 2018-09-25 14:14
brady-wang
阅读(2488)
评论(0)
推荐(0)
摘要:
一、首先我们来看scrapy spider如何打开页面:要打开页面,我们用的是手,同样scrapy也有一个得力助手:spider;至于spider如何打开页面,且听我娓娓道来,如果一上来就噼里啪啦的给诸位说scrapy spiders需要继承神马类、神马方法、神马常量,我想很多喷油都会觉得莫名其妙, 阅读全文
posted @ 2018-09-25 14:08
brady-wang
阅读(989)
评论(0)
推荐(0)

浙公网安备 33010602011771号