第二次结对作业

作业要求	https://edu.cnblogs.com/campus/fzzcxy/2018SE1/homework/11250
作业目标	<根据要求编写代码，建仓，用博客记录作业过程>
作业源代码	https://gitee.com/li-wenlin/pair
队员1	<211806323>
队员2	<211806421>

编码记录

我们对爬虫一无所知，所以我们觉得这次作业太难，如何网络爬取我们需要的数据，如何得到课堂完成部分的所有url再进行解析，如何得到每个同学的信息, 如何处理得到的数据,都是非常值得研究的问题。

网络爬取云班课的数据，将云班课上全班的课堂完成部分的经验值爬取下来，根据经验值排序，看看自己和自己的同学在全班第几名，同时计算出平均经验、最低经验、最高经验。

那么面临的一个问题就是如何进入云班课，万事开头难，这时候我们发现需要用cookie进行模拟登陆。

cookie它！！！

由于要排序的只有课堂完成部分，那么就要找到这一模块，我首先是把所有的作业板块都提取下来，然后判断是否含有“课堂完成”来提取课堂完成部分，当然也可以直接通过span标签获取课堂完成部分内容。

接着我通过判断是否为课堂完成部分进入活动板块的网页地址，获取成绩页面所有成绩，姓名，学号相关模块。

当我们遇到那些没提交作业的同学，要考虑到没评分和未提交的情况，没评分和未提交成绩都为0

posted @ 2020-10-04 22:57 李甘甘阅读(118) 评论(0) 收藏举报

刷新页面返回顶部