摘要: 特征工程 - 特征变换 一、基本概念 特征变换就是对数据进行规范化处理,包括对数据进行特征二值化、标准化、离散化、稀疏化处理等等,达到适用于挖掘的目的。 特征数值化 特征二值化 OneHot编码 数据变换 特征离散化 特征规范化 特征数值化、特征二值化和OneHot编码,都是将标称属性和二元属性的数据,转化为数值属性,满足 阅读全文
posted @ 2023-12-22 15:10 paramotor 阅读(384) 评论(0) 推荐(0)
摘要: 特征工程 - 概念分层(待) 一、基本概念 Concept Hierarchy Operation 概念分层更直观的描述和说明数据,是用户更容易理解。 将数据组织成树状结构,其中层次结构的每一层都代表一个比其下一层更通用的概念。 相同的数据可以具有不同的粒度或细节,并且通过以层次结构的方式组织数据,更容易地理解和执行分析。 具有 阅读全文
posted @ 2023-12-22 15:10 paramotor 阅读(93) 评论(0) 推荐(0)
摘要: 特征工程 - 数据规约 一、基本介绍 Data Reduction 数据规约(数据缩减)是一种以更小的空间获得压缩版本或数据表示的方法,这种压缩数据保持了数据的完整性,并生成了与实际数据类似的分析。 这里不纠结数据规约的具体方法是如何分类的,只关注方法本身。 二、降维 Dimensionality Reduction 下面 阅读全文
posted @ 2023-12-22 13:12 paramotor 阅读(332) 评论(0) 推荐(0)