常用的特征处理方法
摘要:对于机器学习模型,我们把他们分成基于树的模型和非基于树的模型,因为在处理他们的特征需要不同的方法。 1.数值型特征 如果一个特征的值特别大的话,那么会使得其在非树模型上占有很大的比例,所以我们通常对其做归一化处理。 Outliers:不管是对特征还是标签,异常数据对模型的鲁棒性都会带来较大的打击,所
阅读全文
收藏一些机器学习资源
摘要:"天池历届答辩" "Kaggle竞赛解决方案" "scikit learn技术专栏" "贝叶斯优化方法" "结构之法,编程之道" "苍老师的git" "wepon的git" "雪伦的博客:机器学习算法原理及实现专栏" "RDD操作,shuffle和持久化" "Kaggle Competition P
阅读全文