https://www.cnblogs.com/qq124323252/p/14855805.html

01 大数据概述

https://www.cnblogs.com/qq124323252/p/14855850.html 

03 Spark RDD编程基础

交的时候已经过了日期,未能及时的交上去。

1.选择使用什么数据,有哪些字段,多大数据量。
爬取淘宝双十一的数据
字段:商品种类  交易量 消费对比 男女方对比 销量 商品发货地 销售额 商品价格
数据量:4000+

2.准备分析哪些问题,可视化方式?(8个以上)

买家消费行为对比

男女买家交易对比

 商品类别交易

商家的收入类型

优惠力度的比较

3.当前进展。

已有数据