会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
tulintao
博客园
首页
联系
订阅
管理
随笔分类 -
scrapy
上一页
1
2
scrapy-redis分布式爬取猫眼电影
摘要:能够利用redis缓存数据库的优点去重来避免数据的大面积冗余 1、首先就是要创建猫眼爬虫项目 2、进入项目内部创建一个爬虫文件 创建完文件之后就是要爬取的内容,我这边以爬取猫眼电影的title和link为例(这个完全看个人你可以先去写爬虫,然后再来写items文件) 3、编写item文件 4、编写爬
阅读全文
posted @
2019-09-17 08:50
tulintao
阅读(431)
评论(0)
推荐(0)
FakeUserAgentError('Maximum amount of retries reached') 彻底解决办法
摘要:当上面这些方式都无效的时候,就需要使用本地保存获取了
阅读全文
posted @
2019-09-15 14:39
tulintao
阅读(882)
评论(0)
推荐(0)
上一页
1
2
公告