11 2018 档案
摘要:1. 朴素贝叶斯: 条件概率在机器学习算法的应用。理解这个算法需要一点推导。不会编辑公式。。 核心就是 在已知训练集的前提条件下,算出每个特征的概率为该分类的概率, 然后套贝叶斯公式计算 预测集的所有分类概率,预测类型为概率最大的类型
阅读全文
摘要:决策树算法 根据我的理解,决策树算法就是对特征值的权重进行排列,在这个例子里,特征值权重判断的依据就是香农熵, 香农熵越大,不确定性越大,权重越高。 衡量特征值权重的方法应该是造成决策树多样化和影响决策树分类器准确率的主要手段。 然后就是 if else 了 trees.py
阅读全文
摘要:KNN算法的原理很简单: 1. 物以类聚,人以群分:最直观的证据就是你离谁近,所以你们是一类的。 2. 为了防止异类(特殊情况):取最近的N个点,算概率。 所以算法的大致过程: 计算预测数据与每一条训练集(其实并没有经过训练)的距离,然后对结果进行排序。取距离最小的N个点,统计这N歌点每个类出现的次
阅读全文

浙公网安备 33010602011771号