10 期末大作业

https://www.cnblogs.com/xiaolongs/p/14854158.html   04 - RDD编程练习    原因 :晚上学习python错过了提交时间

https://www.cnblogs.com/xiaolongs/p/14854164.html   05 - RDD练习:词频统计    原因:放到博客园忘记提交

https://www.cnblogs.com/xiaolongs/p/14854169.html     07 从RDD创建DataFrame   原因:放假回家忘记提交作业

 

 

 

10 期末大作业

 

1.选择使用什么数据,有哪些字段,多大数据量。

数据:中国疫情数据(腾讯疫情实时更新)

字段:新增累计确诊人数、新增现有确诊人数、现有确诊人数、、累计确诊人数,死亡人数、死亡率,治愈人数,治愈率

数据量:2000

2.准备分析哪些问题,可视化方式?(8个以上)

(1)、中国现有确诊感染人数情况top7,  柱状图

(2)、中国累计确诊感染人数情况top5, 柱状图

(3)、中国各省死亡率与治愈率   线型图

(4)、中国各省死亡人数与治愈人数,线型图

(5)、本土无症状感染者分布          饼图

(6)、各省现有确诊人数分布,饼图

(7)、中国词云,词云,

(8)、现有确诊病例  中国地图显示

3.当前进展。

数据已有

posted @ 2021-06-05 23:42  张先森-  阅读(62)  评论(0)    收藏  举报