摘要: 特征选择原因: 冗余:部分特征的相关度高,容易消耗计算性能 噪声:部分特征对预测结果有影响 一,特征选择(过滤式) 删除低方差的特征 特征选取代码如下: from sklearn.feature_selection import VarianceThreshold def var(): """ 特征 阅读全文
posted @ 2021-01-22 22:17 凝气强者 阅读(309) 评论(0) 推荐(0)
摘要: 一,归一化 处理不同特征之间数据相差不是太大的问题。 特征1 特征2 特征3 特征4 80 2 10 30 40 4 15 40 30 3 12 45 以计算80这个位置进行转换为例,特征1这一列 x‘=(80-30)/(80-30)=1 x''=1*(1-0)+0=1 故80转换化为x''=1 其 阅读全文
posted @ 2021-01-22 22:14 凝气强者 阅读(93) 评论(0) 推荐(0)