11 2022 档案

摘要:一、为什么要进行剪枝? 当我们的数据集样本量很大、每个特征的取值很多时,生成决策树的代价就会很大。不仅如此,虽然一个完整的决策树对训练数据的预测非常准,但这会造成对训练数据的过拟合,造成模型的泛化性能(预测除训练集意外数据的能力)降低。因此,本节我们将引入剪枝的概念。 剪枝的目的:处理决策树的过拟合 阅读全文
posted @ 2022-11-20 22:42 山木L 阅读(447) 评论(0) 推荐(0)
摘要:一.什么是决策树 决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。 决策树算法构造决策树来发现数据中蕴涵的分类规则.如何构造精度高、规模小的决策树是决 阅读全文
posted @ 2022-11-17 13:19 山木L 阅读(463) 评论(0) 推荐(0)
摘要:一.K近邻(K-Nearest Neighbor, KNN)是一种最经典和最简单的有监督学习方法之一。K-近邻算法是最简单的分类器,没有显式的学习过程或训练过程,是懒惰学习(Lazy Learning)。K近邻算法既能够用来解决分类问题,也能够用来解决回归问题。该方法有着非常简单的原理:当对测试样本 阅读全文
posted @ 2022-11-06 16:41 山木L 阅读(162) 评论(0) 推荐(0)
摘要:一.P-R曲线,是指以查准率(亦称准确率)为纵轴、查全率(亦称召回率)为横轴画出的曲线,反映了查准率随查全率的变化趋势! []矩阵概念: (https://img2022.cnblogs.com/blog/2193951/202211/2193951-20221106161303830-116677 阅读全文
posted @ 2022-11-06 16:22 山木L 阅读(1036) 评论(0) 推荐(0)
摘要:一.安装python,anaconda,vscode 1.安装python (1)安装python 进入Python的官网, http://www.python.org/download/,选择合适的python版本进行安装 我安装的是python 3.8.8,可以在cmd中输入python --v 阅读全文
posted @ 2022-11-06 15:50 山木L 阅读(223) 评论(0) 推荐(0)