scrapy抓取拉勾网职位信息(七)——数据存储(MongoDB,Mysql,本地CSV)
摘要:
上一篇完成了随机UA和随机代理的设置,让爬虫能更稳定的运行,本篇将爬取好的数据进行存储,包括本地文件,关系型数据库(以Mysql为例),非关系型数据库(以MongoDB为例)。 实际上我们在编写爬虫rules规则的时候,做了很多的限定,而且没有对翻页进行处理,所以最终提取的信息数量比较少,经我的测试 阅读全文
posted @ 2018-11-28 22:08 月见空青 阅读(465) 评论(0) 推荐(0)
浙公网安备 33010602011771号