会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Kayden_Cheung's Blog
对未来的真正慷慨,是把一切献给现在。
博客园
首页
新随笔
联系
订阅
管理
2018年6月15日
爬虫系列之豆瓣图书排行
摘要: 豆瓣上有图书的排行榜,所以这次写了一个豆瓣的爬虫。 首先是分析排行榜的url 根据这个可以很容易的知道不同图书的排行榜就是在网站后面加上/tag/【类别】,所以我们首先要获得图书的类别信息。 这里可以将读书首页的热门标签给爬下来。 爬取标签内容并不难,代码如下: 接下来是进入排行榜页面进行信息爬取,
阅读全文
posted @ 2018-06-15 20:28 Kayden_Cheung
阅读(1283)
评论(1)
推荐(0)
公告
//目录