10 大作业情况

1.选择使用什么数据,有哪些字段,多大数据量。

     答:us-counties美新冠数据;字段:date,county,state,cases,deaths;数据量:158981条

2.准备分析哪些问题?(8个以上)

 (1).   统计美国截止每日的累计确诊人数和累计死亡人数。做法是以date作为分组字段,对cases和deaths字段进行汇总统计。

(2) 统计美国每日的新增确诊人数和新增死亡人数。

 (3).   统计截止5.19日,美国各州的累计确诊人数和死亡人数。首先筛选出5.19日的数据,然后以state作为分组字段,对cases和deaths字段进行汇总统计。

 (4).   统计截止5.19日,美国确诊人数最多的十个州。对3)的结果DataFrame注册临时表,然后按确诊人数降序排列,并取前10个州。

5、统计截止至5.19日,美国死亡人数最少的前十个州

6、统计美国死亡人数等于0的州

8) 统计截止5.18日,全美和各州的病死率。

9) 统计截止5.19日,美国确诊人数最多的十个州。

posted @ 2021-06-07 19:23  果宝机甲,归位!!!  阅读(47)  评论(0编辑  收藏  举报