随笔分类 -  爬虫

摘要:使用代理抓取https://www.baidu.com/s?wd=ip # -*- coding: utf-8 -*- ''' 一、在settings.py中开启中间件 DOWNLOADER_MIDDLEWARES = { 'daili.middlewares.DailiDownloaderMidd 阅读全文
posted @ 2019-04-04 21:51 请叫我小黄
摘要:一、发送post请求需要将start_urls注释,然后重写start_requests方法二、使用yield scrapy.FormRequest(url=post_url, formdata=formdata, callback=self.parse) # -*- coding: utf-8 - 阅读全文
posted @ 2019-04-04 21:01 请叫我小黄
摘要:Scrapy 框架 Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。 Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的 阅读全文
posted @ 2019-04-04 09:25 请叫我小黄 阅读(178) 评论(0) 推荐(0)