寒假第三次作业
寒假最后一次作业
是该让CSDN歇会了哈哈哈
要求
- 将某个Up主的粉丝数用爬虫的方法抓取下来,并且每小时重新爬取一次,可视化出来。
- 选三个Up主,爬取其粉丝,用合理的算法给出大致正确的粉丝重合度,给出算法时间复杂度,估计算法所用的空间内存。
过程
(代码之后贴上Github)
-
了解爬虫原理、机制(这里强推郑林滢童鞋分享的视频 对概念解释得很详细 Python爬虫介绍),以及一点点requests,matplotlib 照着视频和博客完成第一个任务(中的一部分)
-
爬虫真是个神奇的东西! 接下来继续完成任务一 爬取Jason—老湿的粉丝变化情况并可视化
-
第二个任务 转移阵地到豆瓣 因为这个作业让我爱上了豆瓣网
作业不做光顾着逛网站了...
过程其实就是把用户提取出来,做成列表,再遍历列表算重合度(谢谢旭哥提供参考的代码)
至于时间复杂度估计是n的好多次方(>3),还需后续优化
两百多人只有一个人看了整个系列的电影并写了影评,是真爱粉了
最后还是要感谢大家伙在博客里推荐的链接!!