10 期末大作业

缺交:

https://www.cnblogs.com/wcx136102/p/14819917.html  06 RDD基础  缺交原因:忘了

https://www.cnblogs.com/wcx136102/p/14819615.html  08 学生课程分数的Spark SQL分析  缺交原因:忘了

https://www.cnblogs.com/wcx136102/p/14819913.html  Spark架构与运行流程  缺交原因:忘了

https://www.cnblogs.com/wcx136102/p/14819925.html  Spark SQL 及其DataFrame的基本操作  缺交原因:忘了

https://www.cnblogs.com/wcx136102/p/14840913.html  09 spark连接mysql数据库  缺交原因:忘了

 

 

1.选择使用什么数据,有哪些字段,多大数据量。

数据:中国疫情数据

字段:省份、确诊人数、死亡人数、治愈人数、新增人数

2.准备分析哪些问题,可视化方式?(8个以上)

(1)中国现有感染人数情况, 地图

(2) 中国现有感染人数情况, 柱状图

(3)北上广深现有感染人数情况,柱状图

(4)中国疫情情况,饼图

(5)日新增人数前五的省份,漏斗图

(6)日新增感染人数前八个的省份,散点图

(7)所有省份词云,词云,

(8)现有感染人数前八个的省份, 象型图

3.当前进展。

已有数据

posted @ 2021-06-06 17:11  ''''''''''''''  阅读(101)  评论(0)    收藏  举报