摘要: 特征工程 - 基础概念 一、基本概念 特征工程,得到原始数据集之后,进行机器学习或数据分析之前。 数据集由数据对象组成,数据对象代表一个实体。 数据对象又称样本、实例、数据点。 数据库中的行对应数据对象,列对应属性。 属性是一个数据字段,代表数据对象的一个属性,属性又称为维、特征、变量。 属性包括: 标称属性(nomina 阅读全文
posted @ 2023-12-07 18:21 paramotor 阅读(149) 评论(0) 推荐(0)
摘要: 信息熵 条件熵 信息增益 一、信息熵 $\begin{equation} H(Y) = \sum_{i=1}^n y_i \log y_i \end{equation}$ 单纯的Y的信息混乱程度 二、条件熵 $\begin{equation}\begin{aligned}H(Y|X) & = \sum_{i=1}^n P(X 阅读全文
posted @ 2023-12-07 13:15 paramotor 阅读(78) 评论(0) 推荐(0)