摘要:
class sklearn.ensemble.RandomForestClassifier(n_estimators=’10’, criterion=’gini’, max_depth=None,min_samples_split=2, min_samples_leaf=1, min_weight_ 阅读全文
posted @ 2021-06-23 23:30
秋华
阅读(2004)
评论(0)
推荐(0)
摘要:
class sklearn.ensemble.RandomForestRegressor(n_estimators=’warn’, criterion=’mse’, max_depth=None,min_samples_split=2, min_samples_leaf=1, min_weight_ 阅读全文
posted @ 2021-06-23 22:34
秋华
阅读(1184)
评论(0)
推荐(0)
摘要:
1 概述 1.1 集成算法概述 集成学习(ensemble learning)是时下非常流行的机器学习算法,它本身不是一个单独的机器学习算法,而是通过在数据上构建多个模型,集成所有模型的建模结果。基本上所有的机器学习领域都可以看到集成学习的身影,在现实中集成学习也有相当大的作用,它可以用来做市场营销 阅读全文
posted @ 2021-06-23 21:10
秋华
阅读(448)
评论(0)
推荐(0)
摘要:
我们在红酒数据集上画出了一棵树,并且展示了多个参数会对树形成这样的影响,接下来,我们将在不同结构的数据集上测试一下决策树的效果,让大家更好地理解决策树。 1. 导入需要的库 import numpy as np import matplotlib.pyplot as plt from matplot 阅读全文
posted @ 2021-06-23 20:23
秋华
阅读(393)
评论(0)
推荐(0)
摘要:
1 决策树的优缺点 决策树优点 1. 易于理解和解释,因为树木可以画出来被看见 2. 需要很少的数据准备。其他很多算法通常都需要数据规范化,需要创建虚拟变量并删除空值等。但请注意,sklearn中的决策树模块不支持对缺失值的处理。 3. 使用树的成本(比如说,在预测数据的时候)是用于训练树的数据点的 阅读全文
posted @ 2021-06-23 20:11
秋华
阅读(389)
评论(0)
推荐(0)
摘要:
泰坦尼克号的沉没是世界上最严重的海难事故之一,今天我们通过分类树模型来预测一下哪些人可能成为幸存者。数据集来着https://www.kaggle.com/c/titanic,数据集会随着代码一起提供给大家,大家可以在下载页面拿到,或者到群中询问。数据集包含两个csv格式文件,data为我们接下来要 阅读全文
posted @ 2021-06-23 00:06
秋华
阅读(414)
评论(0)
推荐(0)