会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
hero1
博客园
首页
新随笔
联系
管理
订阅
2019年6月2日
分布式爬虫的搭建-糗事百科(案例)
摘要: 糗事百科采用分布式爬取 1:scrapy-redis的工作原理 有相关scrapy经验者可仔细研究一些,无经验者可直接看下一节内容,等走完流程可在回头看 1,spider打开某网页,获取到一个或者多个request,经由scrapy engine传送给调度器scheduler request特别多并
阅读全文
posted @ 2019-06-02 10:32 hero1
阅读(330)
评论(0)
推荐(0)
2019年5月27日
python爬取豆瓣top250的电影数据并存入excle
摘要: 爬取网址: https://movie.douban.com/top250 输出的list截图: 如果有小伙伴不知道为什么要这样存放数据的话可以看下这个网址:https://www.cnblogs.com/nancyzhu/p/8401552.html,我存入excle的思路就是来源于这个网址,写的
阅读全文
posted @ 2019-05-27 13:18 hero1
阅读(399)
评论(0)
推荐(0)
公告
点击右上角即可分享