文章分类 - 算法--特征工程---数据预处理
摘要:原文 https://wenku.baidu.com/view/aaa16788a48da0116c175f0e7cd184254b351bb0.html 常见的插补方法简述 1 剔除法 如果缺失值所占比例小的话,这个方法十分有效。但是会丢弃了大量隐藏在这些对象中的信息 2 均值插补法 分为数值型和
阅读全文
posted @ 2020-03-31 20:54
大大的海棠湾
摘要:原文 https://blog.csdn.net/m0_38052384/article/details/102738001 在很多机器学习任务中,特征并不总是连续值,有可能是分类值。 ["male", "female"] ["from Europe", "from US", "from Asia"
阅读全文
posted @ 2020-03-31 20:10
大大的海棠湾
摘要:https://www.cnblogs.com/purple5252/p/11343809.html 前言 数据和特征决定了机器学习的上限,而模型和算法知识逼近这个上限而已。 特征工程在机器学习中占有非常重要的地位。 特征工程EDA(探索性数据分析) 数据预处理 特征提取 特征选择 特征构造等子问题
阅读全文
posted @ 2020-03-31 20:03
大大的海棠湾
摘要:原文 https://www.cnblogs.com/purple5252/p/11343769.html 2 统计变换 数据分布的倾斜有很多负面的影响,我们可以使用特征工程技巧,利用统计或者数学变换来减轻分布倾斜的影响。使原本密集的区间的值尽可能的分散,原本分散的区间的值尽量的聚合。 这些变换函数
阅读全文
posted @ 2020-03-31 16:56
大大的海棠湾

浙公网安备 33010602011771号