摘要:
1、 带有L2正则化的线性回归-岭回归 岭回归,其实也是一种线性回归。只不过在算法建立回归方程时候,加上正则化的限制,从而达到解决过拟合的效果 1.1 API sklearn.linear_model.Ridge(alpha=1.0, fit_intercept=True,solver="auto" 阅读全文
posted @ 2020-12-20 21:46
神秘杰尼龟
阅读(210)
评论(0)
推荐(0)
摘要:
问题:训练数据训练的很好啊,误差也不大,为什么在测试集上面有问题呢? 当算法在某个数据集当中出现这种情况,可能就出现了过拟合现象。 1、 什么是过拟合与欠拟合 欠拟合 过拟合 分析 第一种情况:因为机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。 第二种情况:机器已经基本能区别天 阅读全文
posted @ 2020-12-20 21:45
神秘杰尼龟
阅读(624)
评论(0)
推荐(0)
摘要:
1、 线性回归的原理 1.1 线性回归应用场景 房价预测 销售额度预测 金融:贷款额度预测、利用线性回归以及系数分析因子 1.2 什么是线性回归 1.2.1定义与公式 线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的 阅读全文
posted @ 2020-12-20 21:41
神秘杰尼龟
阅读(1046)
评论(0)
推荐(0)
摘要:
1、 什么是集成学习方法 集成学习通过建立几个模型组合的来解决单一预测问题。它的工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成组合预测,因此优于任何一个单分类的做出预测。 2、 什么是随机森林 在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别 阅读全文
posted @ 2020-12-20 21:14
神秘杰尼龟
阅读(154)
评论(0)
推荐(0)
摘要:
1、认识决策树 决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-then结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法 怎么理解这句话?通过一个对话例子 想一想这个女生为什么把年龄放在最上面判断!!!!!!!!! 2、决策树分类原理详解 为了更好理解决策树具体怎么分类的,我 阅读全文
posted @ 2020-12-20 15:15
神秘杰尼龟
阅读(185)
评论(0)
推荐(0)
摘要:
1、 什么是朴素贝叶斯分类方法 2、 概率基础 2.1 概率(Probability)定义 概率定义为一件事情发生的可能性 扔出一个硬币,结果头像朝上 某天是晴天 P(X) : 取值在[0, 1] 2.2 女神是否喜欢计算案例 在讲这两个概率之前我们通过一个例子,来计算一些结果: 问题如下: 那么其 阅读全文
posted @ 2020-12-20 14:57
神秘杰尼龟
阅读(152)
评论(0)
推荐(0)
摘要:
1、为什么需要交叉验证 交叉验证目的:为了让被评估的模型更加准确可信 2、什么是交叉验证(cross validation) 交叉验证:将拿到的训练数据,分为训练和验证集。以下图为例:将数据分成5份,其中一份作为验证集。然后经过5次(组)的测试,每次都更换不同的验证集。即得到5组模型的结果,取平均值 阅读全文
posted @ 2020-12-20 14:46
神秘杰尼龟
阅读(174)
评论(0)
推荐(0)
摘要:
问题:回忆分类问题的判定方法 什么是K-近邻算法 你的“邻居”来推断出你的类别 1、K-近邻算法(KNN) 1.1 定义 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 来源:KNN算法最早是由Cover和Hart提出的一种分类算法 阅读全文
posted @ 2020-12-20 14:39
神秘杰尼龟
阅读(235)
评论(0)
推荐(0)
摘要:
转换器和估计器 1.1 转换器 想一下之前做的特征工程的步骤? 1、实例化 (实例化的是一个转换器类(Transformer)) 2、调用fit_transform(对于文档建立分类词频矩阵,不能同时调用) 我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式 fit_transform 阅读全文
posted @ 2020-12-20 14:26
神秘杰尼龟
阅读(178)
评论(0)
推荐(0)
摘要:
拿到的数据是否全部都用来训练一个模型? 1、 数据集的划分 机器学习一般的数据集会划分为两个部分: 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用于评估模型是否有效 划分比例: 训练集:70% 80% 75% 测试集:30% 20% 30% API sklearn.model_sele 阅读全文
posted @ 2020-12-20 14:13
神秘杰尼龟
阅读(1006)
评论(0)
推荐(0)
浙公网安备 33010602011771号