寒假第三次作业

寒假最后一次作业

是该让CSDN歇会了哈哈哈


要求

  • 将某个Up主的粉丝数用爬虫的方法抓取下来,并且每小时重新爬取一次,可视化出来。
  • 选三个Up主,爬取其粉丝,用合理的算法给出大致正确的粉丝重合度,给出算法时间复杂度,估计算法所用的空间内存。

过程

(代码之后贴上Github)

  • 了解爬虫原理、机制(这里强推郑林滢童鞋分享的视频 对概念解释得很详细 Python爬虫介绍),以及一点点requests,matplotlib 照着视频和博客完成第一个任务(中的一部分)

  • 爬虫真是个神奇的东西! 接下来继续完成任务一 爬取Jason—老湿的粉丝变化情况并可视化

  • 第二个任务 转移阵地到豆瓣 因为这个作业让我爱上了豆瓣网 作业不做光顾着逛网站了...

过程其实就是把用户提取出来,做成列表,再遍历列表算重合度(谢谢旭哥提供参考的代码)

至于时间复杂度估计是n的好多次方(>3),还需后续优化

两百多人只有一个人看了整个系列的电影并写了影评,是真爱粉了

最后还是要感谢大家伙在博客里推荐的链接!!


寒假作业大部分结束,感谢同学们耐心帮助,我也学到了很多有用的知识,学会怎么根据问题去慢慢分析,去查找资料,去请教同学。

咱们开学见!

posted @ 2021-02-22 21:54  JYG1122  阅读(38)  评论(1编辑  收藏