数据分析作业
本次统计的是二战相关的内容
首先找网站:https://bbs.tiexue.net/post2_6187648_1.html
其次设计爬虫:先爬取网页源代码
import urllib.request
b = str(input())
a = urllib.request.urlopen(b)
html = a.read()
html = html.decode("utf-8")
print(html)
然后输入网址,得到源代码如图:

结果呢……因为这个数据的类和原文差不太多不好爬……选择自制图表了……如图……

然后就开始数据分析了
最开始只能随便做想到哪写哪……结果就是啥都做不出来……

比如结果是这样……

于是选择改进代码,学习的更精确点,写成了这样

而结果却几乎没什么变化……只能再简单点……直接把所有东西都罗列在程序里,如图

最终终于还算做出来个图来:

但仍有很大不足:
一,这个所谓的战力对比,其实更应该是堆叠条形图,而不是折线图
二,文字全都没显示出来,却没找到原因。
所以在学习这方面还是不能马虎,不懂就该问,希望下次能更加认真地学习,争取以后自己解决掉这些问题。

浙公网安备 33010602011771号