摘要:
一、V1.0(sklearn版) 1.1简易API 注意, 1)基于树的算法只是计算划分前后混乱度(对每个分类样本数的某种加和)变化,并不对特征进行计算。所以不需要进行标准化、独热编码等。 2)输入的特征不能是字符串型。 import pandas as pd import matplotlib.p 阅读全文
posted @ 2019-08-06 18:47
everda
阅读(394)
评论(0)
推荐(0)
|
摘要:
一、V1.0(sklearn版) 1.1简易API 注意, 1)基于树的算法只是计算划分前后混乱度(对每个分类样本数的某种加和)变化,并不对特征进行计算。所以不需要进行标准化、独热编码等。 2)输入的特征不能是字符串型。 import pandas as pd import matplotlib.p 阅读全文
posted @ 2019-08-06 18:47
everda
阅读(394)
评论(0)
推荐(0)
摘要:
大纲 这篇文章是介绍sklearn库的使用,主要围绕sklearn官网内容进行阐述。包括三个部分的内容: 1.背景——主要介绍sklearn库是干什么的,官网内容板块是怎样的,我们主要从哪块学起; 2.框架——主要从模型使用流程角度出发,阐述sklearn主要实现的内容; 3.API——以从应用出发 阅读全文
posted @ 2019-08-06 17:22
everda
阅读(834)
评论(0)
推荐(0)
摘要:
一、原理阐述 算法类型:监督学习_分类算法 输入:数值型或标称型 V1.0 将测试集挨个按特征的特征值划分,计算划分前与划分后的混乱度之差,将差最大的特征作为第一层节点,得到被该特征的特征值划分出来几块数据。再将这几块数据分别按上面的步骤重复进行(递归过程),直到该块都是同一类或特征值用完为止。 二 阅读全文
posted @ 2019-08-06 17:11
everda
阅读(224)
评论(0)
推荐(0)
|