数据分析作业

本次统计的是二战相关的内容

首先找网站:https://bbs.tiexue.net/post2_6187648_1.html

其次设计爬虫:先爬取网页源代码

import urllib.request
b = str(input())
a = urllib.request.urlopen(b)
html = a.read()
html = html.decode("utf-8")
print(html)

然后输入网址,得到源代码如图:

 

 结果呢……因为这个数据的类和原文差不太多不好爬……选择自制图表了……如图……

 

然后就开始数据分析了

最开始只能随便做想到哪写哪……结果就是啥都做不出来……

 

比如结果是这样……

 

于是选择改进代码,学习的更精确点,写成了这样 

 

 

 而结果却几乎没什么变化……只能再简单点……直接把所有东西都罗列在程序里,如图

 

 

最终终于还算做出来个图来:

 

 

但仍有很大不足:

一,这个所谓的战力对比,其实更应该是堆叠条形图,而不是折线图

二,文字全都没显示出来,却没找到原因。

 

所以在学习这方面还是不能马虎,不懂就该问,希望下次能更加认真地学习,争取以后自己解决掉这些问题。

 

posted @ 2020-05-10 16:19  李拓  阅读(301)  评论(0)    收藏  举报