10 期末大作业
https://www.cnblogs.com/7poom/p/14854276.html 09 spark连接mysql数据库 放在博客里忘记提交了,结果超时了。
大作业:
1.选择使用什么数据,有哪些字段,多大数据量。
数据:中国疫情数据
字段:省份、确诊人数、死亡人数、治愈人数、新增人数
2.准备分析哪些问题,可视化方式?(8个以上)
(1)中国现有感染人数情况, 地图
(2) 中国现有感染人数情况, 柱状图
(3)北上广深现有感染人数情况,柱状图
(4)中国疫情情况,饼图
(5)日新增人数前五的省份,漏斗图
(6)日新增感染人数前八个的省份,散点图
(7)所有省份词云,词云,
(8)现有感染人数前八个的省份, 象型图
3.当前进展。
有了数据表