会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
coder
所有的努力都值得期许,每一份梦想都应该灌溉! qq交流群:948510543 个人博客栈:https://www.fan-tastic.fun/
博客园
首页
新随笔
订阅
管理
2017年7月21日
Python爬虫从入门到放弃(十八)之 Scrapy爬取所有知乎用户信息(上)
摘要: 爬取的思路 首先我们应该找到一个账号,这个账号被关注的人和关注的人都相对比较多的,就是下图中金字塔顶端的人,然后通过爬取这个账号的信息后,再爬取他关注的人和被关注的人的账号信息,然后爬取被关注人的账号信息和被关注信息的关注列表,爬取这些用户的信息,通过这种递归的方式从而爬取整个知乎的所有的账户信息。
阅读全文
posted @ 2017-07-21 02:42 fan-tastic
阅读(17030)
评论(12)
推荐(5)
编辑
公告