摘要:
来源:https://zhuanlan.zhihu.com/p/115646862 之前一直对pandas和numpy里的axis 参数理解的不透彻,今天把它写下来加深印象。 axis = 0 是代表跨行,而axis = 1 是代表跨列,想明白这一点,对于其他的操作就都想明白了。 numpy 官方文 阅读全文
posted @ 2021-06-23 23:59
秋华
阅读(818)
评论(0)
推荐(0)
摘要:
案例中,往往使用真实数据,为什么我们要使用sklearn自带的数据呢?因为真实数据在随机森林下的调参过程,往往非常缓慢。真实数据量大,维度高,在使用随机森林之前需要一系列的处理,因此不太适合用来做直播中的案例演示。在本章,我为大家准备了kaggle上下载的辨别手写数字的数据,有4W多条记录700多个 阅读全文
posted @ 2021-06-23 23:54
秋华
阅读(889)
评论(0)
推荐(0)
摘要:
阅读全文
posted @ 2021-06-23 23:34
秋华
阅读(139)
评论(0)
推荐(0)
摘要:
class sklearn.ensemble.RandomForestClassifier(n_estimators=’10’, criterion=’gini’, max_depth=None,min_samples_split=2, min_samples_leaf=1, min_weight_ 阅读全文
posted @ 2021-06-23 23:30
秋华
阅读(2004)
评论(0)
推荐(0)
摘要:
class sklearn.ensemble.RandomForestRegressor(n_estimators=’warn’, criterion=’mse’, max_depth=None,min_samples_split=2, min_samples_leaf=1, min_weight_ 阅读全文
posted @ 2021-06-23 22:34
秋华
阅读(1185)
评论(0)
推荐(0)
摘要:
1 概述 1.1 集成算法概述 集成学习(ensemble learning)是时下非常流行的机器学习算法,它本身不是一个单独的机器学习算法,而是通过在数据上构建多个模型,集成所有模型的建模结果。基本上所有的机器学习领域都可以看到集成学习的身影,在现实中集成学习也有相当大的作用,它可以用来做市场营销 阅读全文
posted @ 2021-06-23 21:10
秋华
阅读(448)
评论(0)
推荐(0)
摘要:
我们在红酒数据集上画出了一棵树,并且展示了多个参数会对树形成这样的影响,接下来,我们将在不同结构的数据集上测试一下决策树的效果,让大家更好地理解决策树。 1. 导入需要的库 import numpy as np import matplotlib.pyplot as plt from matplot 阅读全文
posted @ 2021-06-23 20:23
秋华
阅读(394)
评论(0)
推荐(0)
摘要:
1 决策树的优缺点 决策树优点 1. 易于理解和解释,因为树木可以画出来被看见 2. 需要很少的数据准备。其他很多算法通常都需要数据规范化,需要创建虚拟变量并删除空值等。但请注意,sklearn中的决策树模块不支持对缺失值的处理。 3. 使用树的成本(比如说,在预测数据的时候)是用于训练树的数据点的 阅读全文
posted @ 2021-06-23 20:11
秋华
阅读(389)
评论(0)
推荐(0)
摘要:
泰坦尼克号的沉没是世界上最严重的海难事故之一,今天我们通过分类树模型来预测一下哪些人可能成为幸存者。数据集来着https://www.kaggle.com/c/titanic,数据集会随着代码一起提供给大家,大家可以在下载页面拿到,或者到群中询问。数据集包含两个csv格式文件,data为我们接下来要 阅读全文
posted @ 2021-06-23 00:06
秋华
阅读(414)
评论(0)
推荐(0)

浙公网安备 33010602011771号