摘要:
节点分裂,特征选择 从概率学角度,样本集中不同样本类别分布地越均匀,说明不确定性越大,比如投掷硬币,50%正,50%负,完全不确定,而决策树模型就是需要选取特征,通过特征取值对样本进行子集划分,使得子集中的不确定性减少。 描述不确定性的算法模型:1 gini纯度 2 信息熵 两个函数都是在样本分布越 阅读全文
posted @ 2021-02-20 11:32
skyer1992
阅读(414)
评论(0)
推荐(0)

浙公网安备 33010602011771号