特征选择1

特征子集的优劣评价:
- filter模型,侧重降维
- wrapper模型,侧重正确率
特征子集的产生

搜索策略:

Permutaion Importance —— 排列重要性
用全部特征,训练一个模型。 验证集预测得到得分。 验证集的一个特征列的值进行随机打乱,预测得到得分。 将上述得分做差即可得到特征x1对预测的影响。 依次将每一列特征按上述方法做,得到每个特征对预测的影响。

特征子集的优劣评价:
特征子集的产生

搜索策略:

用全部特征,训练一个模型。 验证集预测得到得分。 验证集的一个特征列的值进行随机打乱,预测得到得分。 将上述得分做差即可得到特征x1对预测的影响。 依次将每一列特征按上述方法做,得到每个特征对预测的影响。