周志华《机器学习》课后答案——第4章.决策树

周志华老师的《机器学习》是一本非常难得的国内学者的好教材。为了好好学习,博主决定啃一啃周老师书中的课后习题。本人答案仅供参考,若有错误,请大神们不吝指教。(本系列文章实时更新)

1.试证明对于不含冲突数据(即特征向量完全相同但标记不同)的训练集,必存在与训练集一致(即训练误差为0)的决策树。

答:不含冲突数据;决策树是按照特征来进行划分->可以得到每个叶节点中的样本的所有特征及标记完全相同的决策树->与训练集一致。

试析使用"最小训练误差"作为决策树划分选择准则的缺陷

答:使用"最小训练误差"作为决策树划分选择准则,由于使用的是训练集数据,可能会将训练特征中的一些异常或者偶然作为模型的一部分,导致过度拟合的问题。

试编程实现基于信息熵进行划分选择的决策树算法,并为表4.3中数据生成一棵决策树

posted @ 2017-05-03 18:42  zena  阅读(4647)  评论(0编辑  收藏  举报