10 期末大作业
缺交:https://www.cnblogs.com/xwj0920/p/14850399.html 05 RDD练习:词频统计,学习课程分数
原因:当时忘记交了
大作业:
1.选择使用什么数据,有哪些字段,多大数据量。
数据:中国疫情数据
字段:中国地区、新增死亡人数、新增疑似人数、新增确诊人数、累计死亡人数、累计疑似人数、累计确诊人数
数据量:2000
2.准备分析哪些问题,可视化方式?(8个以上)
(1)中国台湾省整个5月的新增死亡人数和新增疑似人数情况, 折线图
(2)中国台湾省整个5月的累计死亡人数、累计疑似人数和累计确诊人数, 折线图
(3)中国台湾省整个5月的新增死亡人数和新增疑似人数情况, 柱状图
(4)中国台湾省整个5月的死亡率,折线图
(5)中国广东省整个4月的新增死亡人数和新增疑似人数情况, 折线图
(6)中国广东省整个4月的累计死亡人数、累计疑似人数和累计确诊人数, 折线图
(7)中国广东省整个4月的新增死亡人数和新增疑似人数情况, 柱状图
(8)中国广东省整个4月的死亡率,折线图
3.当前进展。