摘要:
本文详述了如何通过数据预览,探索式数据分析,缺失数据填补,删除关联特征以及派生新特征等方法,在机器学习竞赛Kaggle的Titanic幸存预测这一分类问题竞赛中获得前2%排名的具体方法。 阅读全文
posted @ 2017-04-13 06:53
郭俊Jason
阅读(7293)
评论(0)
推荐(8)
分享大数据领域技术、包括但不限于Storm、Spark、Hadoop等分布式计算系统,Kafka、MetaQ等分布式消息系统,
MongoDB等NoSQL,PostgreSQL等RDBMS,SQL优化,以及其它前沿技术
2018年10月31日
2018年9月11日
2017年12月21日
2017年11月28日
2017年7月3日
2017年4月25日
2016年8月23日