10 期末作业
补交作业:
https://www.cnblogs.com/willl/p/14855713.html 09 spark连接mysql数据库
https://www.cnblogs.com/willl/p/14855720.html 06 Spark SQL 及其DataFrame的基本操作
https://www.cnblogs.com/willl/p/14855728.html 07 Spark RDD编程 综合实例 英文词频统计
原因:当时没注意看时间,导致错过了提交时间,未能几时提交
大作业:
1.选择使用什么数据,有哪些字段,多大数据量。
数据:us-counties美新冠数据
字段:洲、国家、病例、死亡数日期
2.准备分析哪些问题,可视化方式?(8个以上)
(1) 美国每日的累计确诊病例数和死亡数——>双柱状图
(2) 美国每日的新增确诊病例数和死亡数——>折线图
(3) 美国各州累计确诊、死亡人数和病死率——>表格
(4) 美国累计确诊人数前10的州——>词云图
(5) 美国累计死亡人数前10的州——>柱状图
(6) 美国确诊最少的10个州——>词云图
(7) 美国累计死亡人数最少的10个州——>漏斗图
(8) 美国的病死率——>饼状图
3.当前进展。
数据已有

浙公网安备 33010602011771号