随笔分类 - DataMining
摘要:朴素贝叶斯算法是一种基于概率统计的分类方法,它主要利用贝叶斯公式对样本事件求概率,通过概率进行分类。以下先对贝叶斯公式做个了解。 贝叶斯公式条件概率:对于事件A、B,若P(B)>0,则事件A在事件B发生的条件下发生的概率为: P(A|B)=P(AB)P(B)贝叶斯公式:将条件概率稍...
阅读全文
摘要:C4.5 是对 ID3 的一个优化,它根据信息增益率来进行属性选择。 关于决策树,请参见:http://blog.csdn.net/bone_ace/article/details/46299681 关于 ID3,请参见:http://blog.csdn.net/Bone_ACE/a...
阅读全文
摘要:ID3 是一种用来构建决策树的算法,它根据信息增益来进行属性选择。 关于决策树,请参见:http://blog.csdn.net/bone_ace/article/details/46299681 此处主要介绍 ID3 算法如何利用信息增益选择属性。 信息增益的计算:信息...
阅读全文
摘要:在众多分类算法中,决策树应该是最基本的一种算法了,也是相对比较简单的一种算法。 决策树的介绍:首先,什么叫做决策树?决策树用于解决什么样的问题?先看一个例子: 现有某银行客户拖欠贷款的历史数据,如表 3-1。现在一个新客户{ no, married, 80K, ? } 前来申请贷款...
阅读全文

浙公网安备 33010602011771号