随笔分类 -  机器学习

摘要:决策树的基尼系数计算过程 1、基尼指数的计算 在介绍具体的计算之前,先从一个例子入手吧。 先看看下面这个数据,我们需要通过前三列的特征来推断出最后一列是yes,no 1、数据 Chest PainGood Blood CirculationBlocked ArteriesHeart DiseaseN 阅读全文
posted @ 2020-12-26 12:39 egospace 阅读(370) 评论(0) 推荐(0)
摘要:一、信息量 信息(1.消除不确定性的事物,2.调整概率,3.排除干扰,4.确定情况) 在介绍信息熵之前,让我们先来了解一下什么是信息量。 信息量,信息量,字面意思是信息的量。既然信息可以量化。那么就有大小之分,那么信息量的大小和什么有关呢? 信息量的大小其实和事件的不确定性有关。 1、那么不确定性的 阅读全文
posted @ 2020-12-26 10:42 egospace 阅读(85) 评论(0) 推荐(0)
摘要:朴素贝叶斯(学习笔记) 前言:朴素贝叶斯应该可以说是机器学习十大算法里面里面比较简单的一个了,它主要解决的问题就是一个分类的问题。 1、贝叶斯定理 学过概率论的同学应该都知道贝叶斯定理,所以这里我直接给出它的数学表达式P(Bi|A)= P ( B i ⋅ A ) P ( A ) \frac{P(Bi 阅读全文
posted @ 2020-12-06 18:04 egospace 阅读(35) 评论(0) 推荐(0)