随笔分类 - 机器学习
摘要:逻辑回归 一、逻辑回归的适用性: 优点: 1. 逻辑回归对线性关系的拟合效果好 2. 逻辑回归拟合和计算非常快 3. 逻辑回归返回的分类结果不是固定的0,1,而是以小数的方式出现,可以把结果当成连续数据来使用 缺点: 对数据和场景要求高 二、逻辑回归的基本原理 2.1 什么是逻辑回归 面对一个分类问
阅读全文
摘要:KNN算法 一、KNN算法介绍 KNN算法全称是K Nearest Neighbors ,KNN原理就是当预测一个值属于什么分类,根据它最近的K个分类是什么进行预测它属于什么类别。 重点有两个: K 的确定和距离的计算 距离的计算:欧式距离 K值的计算: 通过交叉验证(将样本数据按照一定的比例拆分成
阅读全文
摘要:多元线性回归 一、多元回归的基本假设 1. 线性性和可加性 线性性:X1每变动一个单位,Y相应变动a1个单位,与X1的绝对数大小无关 可加性:X1对Y的影响独立于其他变量 2. 误差性之间相互独立 3. 自变量之间相互独立 4. 误差项的方差应该为常数 5. 误差项应该呈正太分布 二、线性回归的基本
阅读全文
摘要:决策树原理详解 一、 什么是决策树 决策树是一种监督学习方法,能够从一些列有特征和标签的数据中总结出决策规则,以解决分类和回归问题。在决策树的决策过程中,一直对记录的特征进行提问。最初的问题所在的地方叫做根节点,在得到结论前的每一个问题都是中间节点。得到的每一个结论都叫做叶子节点。 二、 决策树的运
阅读全文
摘要:回归评估 1. 平均绝对误差(Mean Absolute Error, MAE), 又被称为L1范数损失 2. 平均平方误差(Mean Squared Error, MSE ,又被称为l2范数损失 分类平评估指标 二维混淆矩阵 | | 预测 | 结果 | | | : : | : : | | 真实类别
阅读全文
摘要:一、 Apriori关联分析概述 选择物品之间的关联规则也就是要找出物品之间的关系,要找到这种关系有两步 1. 找出频繁一起出现的物品集的集合,我们称之为频繁项集,比如一个超市的频繁项集可能有{{啤酒,尿布}{鸡蛋,牛奶}{香蕉,苹果}} 2. 在频繁项集的基础上,使用关联规则算法找出其中的关联结果
阅读全文

浙公网安备 33010602011771号