一、选题与意义
1.选题:Kaggle分析数据项目:泰坦尼克号:从灾难中学习
2.理由和意义:一:因为第一题需要构建很多镜像和平台,很难预测是否会在安装中报错等等,而且hadoop太久没用过了。第二题的话,所需的软件和环境都以及布置完成了,不需要再去构建。
二:更喜欢Kaggle分析数据
二、实践方案
在https://www.kaggle.com/competitions 上下载数据集,再利用python进行数据处理和分析。
三、实践任务分解

四、实践计划
按任务分解撰写计划表,每天按计划表开展工作。
第天根据实际情况更新计划表,有必要时调整。

1.
- 网站用户购物行为分析
- 官网:http://dblab.xmu.edu.cn/post/7499/
- 淘宝双11数据分析与预测
- 官网:http://dblab.xmu.edu.cn/post/8116/
- 电信用户行为分析
- http://dblab.xmu.edu.cn/post/useranalysis/
大数据平台安装软件:
链接:https://pan.baidu.com/s/1lZM6BkZ6XoRE3uwepsQ_5A
提取码:ao1m
虚拟机镜像文件:
链接:https://pan.baidu.com/s/1e0qak_9Uymn_R1HmSu5ZLw
提取码:q0lt
2.
浙公网安备 33010602011771号