10 期末大作业

https://www.cnblogs.com/084ljx/p/14850240.html     07 Spark RDD编程 综合实例 英文词频统计 

https://www.cnblogs.com/084ljx/p/14850249.html      07 从RDD创建DataFrame

https://www.cnblogs.com/084ljx/p/14850255.html        09 spark连接mysql数据库

 

机房登录不上去,网络提交失败,作业截图一直保存在U盘,回去后校园工作时间错开漏了提交

 

大作业:

1.选择使用什么数据,有哪些字段,多大数据量。

数据:淘宝宠物行业销售情况,宠物子类别销售量情况,搜索量

字段:猫咪,狗狗,主食,零食,水族

2.准备分析哪些问题,可视化方式?(8个以上)

爬行需求,柱状

医疗需求,柱状

猫咪用品需求,柱状

狗狗用品需求,柱状

鸟类需求,柱状

水族需求,柱状

男女比例,柱状

年龄分布,柱状

3.当前进展。

 

已取得部分类别2021年当前数据

 

posted @ 2021-06-06 00:21  暴走的短腿猫  阅读(82)  评论(0)    收藏  举报