2021 年 10月 3 日随笔档案 - Laity-J哥

2021年10月3日

摘要：阅读目录一介绍二、scrapy-redis组件一介绍原来scrapy的Scheduler维护的是本机的任务队列（存放Request对象及其回调函数等信息）+本机的去重队列（存放访问过的url地址）所以实现分布式爬取的关键就是，找一台专门的主机上运行一个共享的队列比如Redis，然后重写阅读全文

posted @ 2021-10-03 13:04 Laity-J哥阅读(187) 评论(0) 推荐(0)

爬虫框架：scrapy

摘要：阅读目录一介绍二安装三命令行工具四项目结构以及爬虫应用简介五 Spiders 六 Selectors 七 Items 八 Item Pipeline 九 Dowloader Middeware 十 Spider Middleware 十一自定义扩展十二 settings.py 阅读全文

posted @ 2021-10-03 12:58 Laity-J哥阅读(322) 评论(0) 推荐(2)

BKY_J哥

踏实，努力，你想要的，岁月统统都会给你。

公告