摘要: 4 非线性变换 有些场景中,采集到的数据并不需要以连续性的方式呈现,而是以一些非线性的方式呈现,比如: 考试分数的及格线 家庭年收入划分 诸如此类,此时只需要对数据进行区间划分,或者表现数据内部间的相对关系。在非线性变换过程中,可以摒弃一部分数据的“精度”,用离散的数学表示取代连续的数学表示,数据直 阅读全文
posted @ 2022-12-18 23:09 努力生活的小林 阅读(201) 评论(0) 推荐(0)
摘要: 数据和特征决定了机器学习的上限,模型和算法只是去逼近这个上限。特征工程的本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。数据预处理则是特征工程的一个主要部分。 简单来说,数据预处理就是将原始数据转化为便于机器学习模型学习的数据,但在实际的场景中,文本及图像等非数字数据应当 阅读全文
posted @ 2022-12-18 23:08 努力生活的小林 阅读(144) 评论(0) 推荐(0)