随笔分类 - 数据挖掘竞赛
kaggle数据挖掘竞赛初步--Titanic<随机森林&特征重要性>
摘要:完整代码:https://github.com/cindycindyhi/kaggle-Titanic特征工程系列:Titanic系列之原始数据分析和数据处理Titanic系列之数据变换Titanic系列之派生属性&维归约之前的三篇博文已经进行了一次还算完整的特征工程,分析字符串类型的变量获取新变量...
阅读全文
kaggle数据挖掘竞赛初步--Titanic<派生属性&维归约>
摘要:完整代码:https://github.com/cindycindyhi/kaggle-Titanic特征工程系列:Titanic系列之原始数据分析和数据处理Titanic系列之数据变换Titanic系列之派生属性&维归约为什么有的机器学习项目成功了有的却失败了呢?毕竟算法是有限的改进也是有限的,最...
阅读全文
kaggle数据挖掘竞赛初步--Titanic<数据变换>
摘要:完整代码:https://github.com/cindycindyhi/kaggle-Titanic特征工程系列:Titanic系列之原始数据分析和数据处理Titanic系列之数据变换Titanic系列之派生属性&维归约缺失值填充之后,就要对其他格式有问题的属性进行处理了。比如Sex Embark...
阅读全文
kaggle数据挖掘竞赛初步--Titanic<原始数据分析&缺失值处理>
摘要:Titanic是kaggle上的一道just for fun的题,没有奖金,但是数据整洁,拿来练手最好不过啦。这道题给的数据是泰坦尼克号上的乘客的信息,预测乘客是否幸存。这是个二元分类的机器学习问题,但是由于数据样本相对较少,在当时慌乱的情况下幸存者有一定的随机性,还是有一定挑战的。https://...
阅读全文
浙公网安备 33010602011771号