会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Loading
Thank CAT
博客园
首页
管理
上一页
1
2
3
4
5
6
7
8
9
···
15
下一页
2023年4月5日
随机森林n_estimators 学习曲线
摘要: 随机森林 单颗树与随机森林的的分对比 # 导入包 from sklearn.datasets import load_wine from sklearn.model_selection import train_test_split from sklearn.tree import Decision
阅读全文
posted @ 2023-04-05 00:54 ThankCAT
阅读(678)
评论(0)
推荐(0)
2023年4月3日
泰坦尼克号生还预测
摘要: 泰坦尼克号生还预测 导入模块 import pandas as pd # 数据处理 import matplotlib.pyplot as plt # 画图 from sklearn.tree import DecisionTreeClassifier # 决策树模型 from sklearn.mo
阅读全文
posted @ 2023-04-03 16:53 ThankCAT
阅读(90)
评论(0)
推荐(0)
DecisionTreeClassifier&DecisionTreeClassRegression
摘要: DecisionTreeClassifier from sklearn.datasets import load_wine # 红酒数据集 from sklearn.tree import DecisionTreeClassifier, export_graphviz # 决策树, 画树 from
阅读全文
posted @ 2023-04-03 16:52 ThankCAT
阅读(69)
评论(0)
推荐(0)
2023年3月31日
机器学习基础09DAY
摘要: 分类算法之逻辑回归 逻辑回归(Logistic Regression),简称LR。它的特点是能够是我们的特征输入集合转化为0和1这两类的概率。一般来说,回归不用在分类问题上,因为回归是连续型模型,而且受噪声影响比较大。如果非要应用进入,可以使用逻辑回归。了解过线性回归之后再来看逻辑回归可以更好的理解
阅读全文
posted @ 2023-03-31 11:53 ThankCAT
阅读(162)
评论(0)
推荐(0)
2023年3月29日
机器学习08DAY
摘要: 线性回归 波士顿房价预测案例 步骤 导入数据 数据分割 数据标准化 正规方程预测 梯度下降预测 # 导入模块 import pandas as pd # 导入数据 from sklearn.model_selection import train_test_split # 数据分割 from skl
阅读全文
posted @ 2023-03-29 22:30 ThankCAT
阅读(63)
评论(0)
推荐(0)
机器学习基础07DAY
摘要: 分类算法之决策树 决策树是一种基本的分类方法,当然也可以用于回归。我们一般只讨论用于分类的决策树。决策树模型呈树形结构。在分类问题中,表示基于特征对实例进行分类的过程,它可以认为是if-then规则的集合。在决策树的结构中,每一个实例都被一条路径或者一条规则所覆盖。通常决策树学习包括三个步骤:特征选
阅读全文
posted @ 2023-03-29 10:36 ThankCAT
阅读(60)
评论(0)
推荐(0)
2023年3月28日
机器学习基础06DAY
摘要: 模型检验-交叉验证 一般在进行模型的测试时,我们会将数据分为训练集和测试集。在给定的样本空间中,拿出大部分样本作为训练集来训练模型,剩余的小部分样本使用刚建立的模型进行预测。 训练集与测试集 训练集与测试集的分割可以使用cross_validation中的train_test_split方法,大部分
阅读全文
posted @ 2023-03-28 11:20 ThankCAT
阅读(52)
评论(0)
推荐(0)
2023年3月26日
机器学习基础05DAY
摘要: 分类算法之k-近邻 k-近邻算法采用测量不同特征值之间的距离来进行分类 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 使用数据范围:数值型和标称型 一个例子弄懂k-近邻 电影可以按照题材分类,每个题材又是如何定义的呢?那么假如两种类型的电影,动作片和爱情片。动作片有
阅读全文
posted @ 2023-03-26 23:46 ThankCAT
阅读(133)
评论(0)
推荐(0)
2023年3月25日
机器学习基础04DAY
摘要: scikit-learn数据集 我们将介绍sklearn中的数据集类,模块包括用于加载数据集的实用程序,包括加载和获取流行参考数据集的方法。它还具有一些人工数据生成器。 sklearn.datasets (1)datasets.load_*() 获取小规模数据集,数据包含在datasets里 (2)
阅读全文
posted @ 2023-03-25 23:20 ThankCAT
阅读(224)
评论(0)
推荐(0)
2023年3月23日
机器学习基础03DAY
摘要: 特征降维 降维 PCA(Principal component analysis),主成分分析。特点是保存数据集中对方差影响最大的那些特征,PCA极其容易受到数据中特征范围影响,所以在运用PCA前一定要做特征标准化,这样才能保证每维度特征的重要性等同。 sklearn.decomposition.P
阅读全文
posted @ 2023-03-23 21:23 ThankCAT
阅读(62)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
···
15
下一页
公告