摘要: 1. 简介 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。 缺点:可能会产生过度匹配问题 适用:数值型和标称型 一般流程: 1. 信息增益 熵:信息的期望值 n:分类的数目 p(xi):选择该分类的概率 python中实现 建立trees.py文件,创建cal 阅读全文
posted @ 2017-02-21 16:50 rockchen 阅读(759) 评论(0) 推荐(0)