10 期末大作业

02 Spark架构与运行流程(补) - 杨易霖 - 博客园 (cnblogs.com)

05 RDD练习:词频统计(补) - 杨易霖 - 博客园 (cnblogs.com)

06 Spark SQL 及其DataFrame的基本操作(补) - 杨易霖 - 博客园 (cnblogs.com)

07 Spark RDD编程 综合实例 英文词频统计(补) - 杨易霖 - 博客园 (cnblogs.com)

07 Spark SQL 及其DataFrame的基本操作(补) - 杨易霖 - 博客园 (cnblogs.com)

09 spark连接mysql数据库(补) - 杨易霖 - 博客园 (cnblogs.com)

没交原因:忘记交

1.选择使用什么数据,有哪些字段,多大数据量。
爬取淘宝商品数据
字段:商品种类 销量 商品发货地 销售额 商品价格
数据量:4000+

2.准备分析哪些问题,可视化方式?(8个以上)

1.不同类型商品销量 柱状图

2.商品价格 饼图

3.商品分布 柱状图

4.价格销量影响图 散点图

5.商品价格对销售额影响 散点图

6.商品区域 柱状图

7.商品类型 饼图

8.地理位置 饼状图

3.当前进展。
已有数据

 

posted @ 2021-06-06 17:25  杨易霖  阅读(77)  评论(0)    收藏  举报