10 期末大作业
缺交:
https://www.cnblogs.com/xjh1/p/14856248.html 02 Spark架构与运行流程
https://www.cnblogs.com/xjh1/p/14856235.html 03 Spark RDD编程基础
https://www.cnblogs.com/xjh1/p/14856241.html 06 Spark SQL 及其DataFrame的基本操作
https://www.cnblogs.com/xjh1/p/14856238.html 07 Spark RDD编程 综合实例 英文词频统计
https://www.cnblogs.com/xjh1/p/14856244.html 09 spark连接mysql数据库
缺交原因:几次没注意好时间,导致错过了;
大作业:
1.选择使用什么数据,有哪些字段,多大数据量。
数据:美国疫情数据
字段:新增累计确诊人数、新增现有确诊人数、现有确诊人数、、累计确诊人数,死亡人数、死亡率,治愈人数,治愈率
2.准备分析哪些问题,可视化方式?(8个以上)
(1) 画出每日的累计确诊病例数和死亡数——>双柱状图
(2) 画出每日的新增确诊病例数和死亡数——>折线图
(3) 画出美国确诊最多的10个州——>词云图
(4) 画出美国死亡最多的10个州——>象柱状图
(5) 找出美国确诊最少的10个州——>词云图
(6) 找出美国死亡最少的10个州——>漏斗图
3.当前进展。
已完成

浙公网安备 33010602011771号