10 期末大作业

补交作业

01 Spark架构与运行流程,https://www.cnblogs.com/0311Chrome/p/14856587.html(第一次作业)

原因:当时忘记这次作业了

Spark RDD编程,https://www.cnblogs.com/0311Chrome/p/14856591.html(第二次作业)

原因,当时做完了忘记保存下来想着第二天再重新做也忘记了

RDD编程练习,https://www.cnblogs.com/0311Chrome/p/14856591.html(第三次作业)

原因,当时也是忘记了写作业了

 

大作业:

1.选择使用什么数据,有哪些字段,多大数据量。

美国新冠肺炎疫情数据集,字段:累计确诊人数、累计死亡人数、新增确诊人数、新增死亡人数、各州累计确诊人数、各州累计死亡人数和美国各州

2.准备分析哪些问题?(8个以上)

美国每日的累计确诊病例数和死亡数

美国每日的新增确诊病例数

美国每日的新增死亡病例数

截止5.19,美国各州累计确诊、死亡人数和病死率

截止5.19,美国累计确诊人数前10的州

截止5.19,美国累计死亡人数前10的州

截止5.19,美国累计确诊人数最少的10个州

截止5.19,美国累计死亡人数最少的10个州

截止5.19,美国的病死率

posted @ 2021-06-06 22:12  碎觉觉  阅读(70)  评论(0编辑  收藏  举报