10 期末大作业

缺交:https://www.cnblogs.com/xwj0920/p/14850399.html        05 RDD练习:词频统计,学习课程分数

原因:当时忘记交了

 

 

大作业:

1.选择使用什么数据,有哪些字段,多大数据量。

数据:中国疫情数据

字段:中国地区、新增死亡人数、新增疑似人数、新增确诊人数、累计死亡人数、累计疑似人数、累计确诊人数

数据量:2000

2.准备分析哪些问题,可视化方式?(8个以上)

(1)中国台湾省整个5月的新增死亡人数和新增疑似人数情况, 折线图

(2)中国台湾省整个5月的累计死亡人数、累计疑似人数和累计确诊人数, 折线图

(3)中国台湾省整个5月的新增死亡人数和新增疑似人数情况, 柱状图

(4)中国台湾省整个5月的死亡率,折线图

(5)中国广东省整个4月的新增死亡人数和新增疑似人数情况, 折线图

(6)中国广东省整个4月的累计死亡人数、累计疑似人数和累计确诊人数, 折线图

(7)中国广东省整个4月的新增死亡人数和新增疑似人数情况, 柱状图

(8)中国广东省整个4月的死亡率,折线图

3.当前进展。

posted @ 2021-06-07 16:26  XWJ0920  阅读(29)  评论(0编辑  收藏  举报