大数据应用技术课程实践--选题与实践方案
2020-06-23 17:34 当地一个比较帅的人 阅读(205) 评论(0) 收藏 举报一、选题与意义
1.Hadoop平台应用
2.Kaggle分析数据项目
简要说明理由与意义。
Kaggle分析数据项目:kaggle泰坦尼克之灾
https://www.kaggle.com/c/titanic
首先是自己电脑配置的硬件问题,再之后是因为对这个比较感兴趣,而且这个项目可以参赛获奖,
我可以先从这个比较简单的项目入手。
二、实践方案
从kaggle平台下载数据,然后用python语言对数据进行分析处理,我的电脑已经装好了python3.7,环境配置好了,
编辑软件有pycharm、anaconda。
三、实践任务分解
根据所选的题目,明确实验步骤,分解任务到每天。
1、获取数据
2、清洗数据
3、分析数据
4、建立模型
5、训练模型
6、模型评测
四、实践计划
按任务分解撰写计划表,每天按计划表开展工作。
第天根据实际情况更新计划表,有必要时调整。
1、获取数据
2、清洗数据
3、分析数据
4、建立模型
5、训练模型
6、模型评测
kaggle平台:
https://www.kaggle.com/competitions
说明:
- 个人项目,不要求组队,确实需要组队的说明理由。
- 边操作边记录;
- 每天完成当天文档;
- 最后综合成课程实践报告。