代码改变世界

机器学习进阶前准备之一决策树

2017-09-29 17:12  legenecy  阅读(141)  评论(0)    收藏  举报

机器学习是模拟人通过以往的经验,做出相应的判断。而机器学习经过数据,训练好模型,相当于函数,预测出结构。

其中决策树是一种有监督的学习,是一种树形结构,我们首先通过一定的算法,把数据集,通过算法确定标准属性,通过属性,从父节点往下分为几个叶子结点。

 算法其中一种就是信息熵,通过它的公式,确定它的属性。然后再划分。

计算公式

H(x) = E[I(xi)] = E[ log(2,1/p(xi)) ] = -∑p(xi)log(2,p(xi)) (i=1,2,..n)