10 期末大作业

补交作业:

02 Spark架构与运行流程  https://www.cnblogs.com/tangweiyi/p/14854951.html 

04 RDD编程练习 https://www.cnblogs.com/tangweiyi/p/14854962.html

08 学生课程分数的Spark SQL分析 https://www.cnblogs.com/tangweiyi/p/14854967.html 

补交原因:迟交

1.选择使用什么数据,有哪些字段,多大数据量。

豆瓣电影网站数据

影片名称列表,所在区域的影片简介,评分等

2.准备分析哪些问题,可视化方式?(8个以上)

1.影片表 柱状图
2影片出现次数年份分布 柱状图
3.电影类型 柱状图
4.影片类型 词云
5.上映区间 饼图
6.电影评分 柱状图
7.上映年份 柱状图
8.评分表 柱状图

3.当前进展。

已有数据

posted @ 2021-06-06 12:21  圆圆圆圆1111  阅读(50)  评论(0)    收藏  举报