摘要: ID3 (信息增益):分类 定义:信息增益 g(D, A) = 数据集D的经验熵 H(D) - 某个特征A对于数据集D的经验条件熵 H(D | A) 步骤:计算每个特征的信息增益,取信息增益最大的特征作为划分。 缺点:偏向于选择取值较多的特征,影响分类的泛化能力。 比如一个特征由原来的两个取值,变为 阅读全文
posted @ 2018-10-20 10:36 崔馨月 阅读(142) 评论(0) 推荐(0)