摘要:
scrapy结构图: scrapy组件: ENGINE:引擎,框架的核心,其它所有组件在其控制下协同工作。 SCHEDULER:调度器,负责对SPIDER提交的下载请求进行调度。 DOWNLOADER:下载器,负责下载页面(发送HTTP请求/接收HTTP响应)。 SPIDER:爬虫,负责提取页面中的 阅读全文
posted @ 2019-09-22 12:20
潇潇六月雨
阅读(263)
评论(0)
推荐(0)
摘要:
1.什么是scrapy? Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。框架的本质就是集成各种功能、具有很强通用性的项目模板。 2.安装 Linux: pip3 install scrapy Windows: 》见Twisted安装 a. pip3 install wheel 阅读全文
posted @ 2019-09-22 12:13
潇潇六月雨
阅读(466)
评论(0)
推荐(0)
浙公网安备 33010602011771号