期末大作业
1.选择使用什么数据,有哪些字段,多大数据量。
答:使用美国新冠的数据。里面有字段:date,county,state,cases,deaths。一共有158981条数据。
2.准备分析哪些问题?(8个以上)
(1). 统计美国截止每日的累计确诊人数和累计死亡人数。
(2). 统计美国每日的新增确诊人数和新增死亡人数。
(3). 统计截止5.19日,美国各州的累计确诊人数和死亡人数。
(4). 统计截止5.19日,美国确诊人数最多的十个州。
(5). 统计截止5.19日,美国死亡人数最多的十个州。
(6). 统计截止5.19日,美国确诊人数最少的十个州。
(7). 统计截止5.19日,美国死亡人数最少的十个州。
(8).统计截止5.19日,全美和各州的病死率。
3.当前进展。
对数据进行预处理