摘要: 特征工程:特征抽象、特征衍生 特征抽象 这一步是针对有序和无序的文本分类型特征,采用不同的方法进行处理,将其类别属性数值化。 多值有序特征的属性数值映射,这步也包含了降维处理(对于高维类别变量),把类别抽象成模型可以识别的特征值。有序特征的映射,使用的方法是先构建一个映射字典mapping,再用pa 阅读全文
posted @ 2019-02-22 19:21 吊车尾88 阅读(2556) 评论(0) 推荐(0)
摘要: 数据科学领域从业者普遍认为:数据和特征决定了机器学习效果的上限,而模型和算法只是逼近这个上限。而特征工程就是逼近这个上限的极速器。特征工程处理后的特征越好,模型的可选择性和灵活性越强,同时也降低了模型的复杂度,提升模型的效果,执行的效率及模型的可解释性。特征工程的最终目的就是提升模型的性能。 特征工 阅读全文
posted @ 2019-02-22 19:15 吊车尾88 阅读(1452) 评论(0) 推荐(0)