博客班级 | https://edu.cnblogs.com/campus/fzzcxy/2018SE2 |
---|---|
作业要求 | https://edu.cnblogs.com/campus/fzzcxy/2018SE2/homework/11169 |
作业目标 | 学习jsoup爬虫、git远程仓库传输、读取配置文件 |
作业源代码 | https://gitee.com/yu1392250489/personal |
学号 | 211806420 |
一、代码与时间 | |
代码行数 | 81 |
---------- | -------------------------------------- |
分析时间 | 1h |
编程时间 | 4h |
学习时间 | 10h |
总时间 | 15h |
二、思路 | |
1:分析如何才能有效抓取文字。根据提示可知课前自测、课堂完成、课堂小测、编程题、附加题是有效的关键文字,根据它们着手代码属实明智之举; | |
2:分析代码的架构。好的架构可以让人神清气爽,头脑灵活多变,思维跳跃有度,就像水里的小鲤鱼很活跃。 | |
3:分析算法的组成。算法的重要性可想而知,没有她就不能精确地得出结果。 | |
三、学习过程 | |
1:在学习git的过程中,我发现用git pull origin master --allow-unrelated-histories实现同步远程库时,一旦密码或账号输入错误,下一次输入此代码将会跳过账号密码的输入界面,直接报错——账号或密码错误。在看了云班课上的ppt——Git的安装与使用之后,发现原来要将文件上传到远程库之前需要先建立本地库。在建完本地库之后,上面那个代码也就无异常了。![]() |
|
2:使用jsoup抓取文字时,比如“编程题”和“有参与”,一旦一题编程题都没做,那么也就是都没有“有参与”,这时代码就会报错。这时我们就需要将“编程题”改成其他类似“结课”的文字,问题也就迎刃而解了,删掉整段代码也无妨。![]() |
四、资料网站
1:https://jsoup.org
2:https://www.jianshu.com/p/59280eb56cd7
五、总结
一开始的我是十分懵逼的😒,我完全看不懂这是要做什么,就好像初生的稚儿一般,对着大千世界有着无限的好奇与疑惑😢。我明白了!也许这就是学艺不精的下场,但凡是平时或以前能够多学一点知识,也不至于沦落到如此地步<(  ̄^ ̄)。我决定了!以后我一定……不能说以后,我希望,白天能够学习,夜晚能够撒泼般地玩耍,也好让我在人生中有点自己的东西,自己的真本事,这样才能吃的香,走得勤😏。