摘要:
一、基本概念 特征工程,得到原始数据集之后,进行机器学习或数据分析之前。 数据集由数据对象组成,数据对象代表一个实体。 数据对象又称样本、实例、数据点。 数据库中的行对应数据对象,列对应属性。 属性是一个数据字段,代表数据对象的一个属性,属性又称为维、特征、变量。 属性包括: 标称属性(nomina 阅读全文
一、基本概念 特征工程,得到原始数据集之后,进行机器学习或数据分析之前。 数据集由数据对象组成,数据对象代表一个实体。 数据对象又称样本、实例、数据点。 数据库中的行对应数据对象,列对应属性。 属性是一个数据字段,代表数据对象的一个属性,属性又称为维、特征、变量。 属性包括: 标称属性(nomina 阅读全文
posted @ 2023-12-07 18:21
paramotor
阅读(149)
评论(0)
推荐(0)
摘要:
一、信息熵 $\begin{equation} H(Y) = \sum_{i=1}^n y_i \log y_i \end{equation}$ 单纯的Y的信息混乱程度 二、条件熵 $\begin{equation}\begin{aligned}H(Y|X) & = \sum_{i=1}^n P(X 阅读全文
一、信息熵 $\begin{equation} H(Y) = \sum_{i=1}^n y_i \log y_i \end{equation}$ 单纯的Y的信息混乱程度 二、条件熵 $\begin{equation}\begin{aligned}H(Y|X) & = \sum_{i=1}^n P(X 阅读全文
posted @ 2023-12-07 13:15
paramotor
阅读(78)
评论(0)
推荐(0)

浙公网安备 33010602011771号