10 期末大作业

缺交:

https://www.cnblogs.com/xjh1/p/14856248.html   02 Spark架构与运行流程

https://www.cnblogs.com/xjh1/p/14856235.html   03 Spark RDD编程基础

https://www.cnblogs.com/xjh1/p/14856241.html   06 Spark SQL 及其DataFrame的基本操作

https://www.cnblogs.com/xjh1/p/14856238.html   07 Spark RDD编程 综合实例 英文词频统计

https://www.cnblogs.com/xjh1/p/14856244.html   09 spark连接mysql数据库

缺交原因:几次没注意好时间,导致错过了;

 

大作业:

1.选择使用什么数据,有哪些字段,多大数据量。

数据:美国疫情数据

字段:新增累计确诊人数、新增现有确诊人数、现有确诊人数、、累计确诊人数,死亡人数、死亡率,治愈人数,治愈率

2.准备分析哪些问题,可视化方式?(8个以上)

(1)  画出每日的累计确诊病例数和死亡数——>双柱状图

(2)  画出每日的新增确诊病例数和死亡数——>折线图

(3)  画出美国确诊最多的10个州——>词云图

(4)  画出美国死亡最多的10个州——>象柱状图

(5)  找出美国确诊最少的10个州——>词云图

(6)  找出美国死亡最少的10个州——>漏斗图

3.当前进展。

已完成

posted @ 2021-06-06 20:12  OHUO2  阅读(43)  评论(0)    收藏  举报