10 期末大作业
补交作业:
02 Spark架构与运行流程 https://www.cnblogs.com/tangweiyi/p/14854951.html
04 RDD编程练习 https://www.cnblogs.com/tangweiyi/p/14854962.html
08 学生课程分数的Spark SQL分析 https://www.cnblogs.com/tangweiyi/p/14854967.html
补交原因:迟交
1.选择使用什么数据,有哪些字段,多大数据量。
豆瓣电影网站数据
影片名称列表,所在区域的影片简介,评分等
2.准备分析哪些问题,可视化方式?(8个以上)
1.影片表 柱状图
2影片出现次数年份分布 柱状图
3.电影类型 柱状图
4.影片类型 词云
5.上映区间 饼图
6.电影评分 柱状图
7.上映年份 柱状图
8.评分表 柱状图
3.当前进展。
已有数据
浙公网安备 33010602011771号