10 期末大作业
02 Spark架构与运行流程(补) - 杨易霖 - 博客园 (cnblogs.com)
05 RDD练习:词频统计(补) - 杨易霖 - 博客园 (cnblogs.com)
06 Spark SQL 及其DataFrame的基本操作(补) - 杨易霖 - 博客园 (cnblogs.com)
07 Spark RDD编程 综合实例 英文词频统计(补) - 杨易霖 - 博客园 (cnblogs.com)
07 Spark SQL 及其DataFrame的基本操作(补) - 杨易霖 - 博客园 (cnblogs.com)
09 spark连接mysql数据库(补) - 杨易霖 - 博客园 (cnblogs.com)
没交原因:忘记交
1.选择使用什么数据,有哪些字段,多大数据量。
爬取淘宝商品数据
字段:商品种类 销量 商品发货地 销售额 商品价格
数据量:4000+
2.准备分析哪些问题,可视化方式?(8个以上)
1.不同类型商品销量 柱状图
2.商品价格 饼图
3.商品分布 柱状图
4.价格销量影响图 散点图
5.商品价格对销售额影响 散点图
6.商品区域 柱状图
7.商品类型 饼图
8.地理位置 饼状图
3.当前进展。
已有数据

浙公网安备 33010602011771号