董星辉

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

一、选题与意义

  1.选题:Kaggle分析数据项目:泰坦尼克号:从灾难中学习

  2.理由和意义:一:因为第一题需要构建很多镜像和平台,很难预测是否会在安装中报错等等,而且hadoop太久没用过了。第二题的话,所需的软件和环境都以及布置完成了,不需要再去构建。

                          二:更喜欢Kaggle分析数据

二、实践方案

  在https://www.kaggle.com/competitions 上下载数据集,再利用python进行数据处理和分析。

三、实践任务分解

 

 

四、实践计划

按任务分解撰写计划表,每天按计划表开展工作。

第天根据实际情况更新计划表,有必要时调整。

 

 

 

1.

 

大数据平台安装软件:

链接:https://pan.baidu.com/s/1lZM6BkZ6XoRE3uwepsQ_5A
提取码:ao1m

虚拟机镜像文件:

链接:https://pan.baidu.com/s/1e0qak_9Uymn_R1HmSu5ZLw  
提取码:q0lt

 

2.

https://www.kaggle.com/competitions

posted on 2020-06-23 21:08  D2012  阅读(203)  评论(0)    收藏  举报