10 期末大作业
https://www.cnblogs.com/xiaolongs/p/14854158.html 04 - RDD编程练习 原因 :晚上学习python错过了提交时间
https://www.cnblogs.com/xiaolongs/p/14854164.html 05 - RDD练习:词频统计 原因:放到博客园忘记提交
https://www.cnblogs.com/xiaolongs/p/14854169.html 07 从RDD创建DataFrame 原因:放假回家忘记提交作业
10 期末大作业
1.选择使用什么数据,有哪些字段,多大数据量。
数据:中国疫情数据(腾讯疫情实时更新)
字段:新增累计确诊人数、新增现有确诊人数、现有确诊人数、、累计确诊人数,死亡人数、死亡率,治愈人数,治愈率
数据量:2000
2.准备分析哪些问题,可视化方式?(8个以上)
(1)、中国现有确诊感染人数情况top7, 柱状图
(2)、中国累计确诊感染人数情况top5, 柱状图
(3)、中国各省死亡率与治愈率 线型图
(4)、中国各省死亡人数与治愈人数,线型图
(5)、本土无症状感染者分布 饼图
(6)、各省现有确诊人数分布,饼图
(7)、中国词云,词云,
(8)、现有确诊病例 中国地图显示
3.当前进展。
数据已有

浙公网安备 33010602011771号