上一页 1 2 3 4 5 6 ··· 11 下一页
摘要: 关联分析 概述:一种在大规模数据集中寻找有趣关系的任务。 这种关系形式:频繁项集或者关联规则。 频繁项集:经常出现在一块的物品集合。 关联规则:暗示物品之间可能存在很强的关系。 对频繁的度量: 支持度和可信度 支持度:数据集中包含该项集的记录所占的比例 可信度或者置信度: 针对诸如:{尿布}->{葡 阅读全文
posted @ 2022-09-15 16:36 酷酷的排球 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 关联分析 概述:一种在大规模数据集中寻找有趣关系的任务。 这种关系形式:频繁项集或者关联规则。 频繁项集:经常出现在一块的物品集合。 关联规则:暗示物品之间可能存在很强的关系。 对频繁的度量: 支持度和可信度 支持度:数据集中包含该项集的记录所占的比例 可信度或者置信度: 针对诸如:{尿布}->{葡 阅读全文
posted @ 2022-09-15 11:03 酷酷的排球 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 聚类算法 概述: 训练数据不存在类别标签信息,而且我们又需要根据数据特征将数据分成不同的类别, 聚类有时也被分为无监督分类, 和监督分类区别在于,聚类的训练数据没有对应的y值,而监督算法的数据有对应y值。 经典算法:K-均值聚类 K-均值聚类算法 优点:容易实现; 缺点:可能收敛到局部最小值,在大规 阅读全文
posted @ 2022-09-14 17:00 酷酷的排球 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 回归 线性回归 回归系数求解方法:常用最小二乘法 缺点:由于采用具有最小均方误差的无偏估计,可能出现欠拟合现象 解决办法: 局部加权线性回归 局部加权线性回归(Locally Weighted Linear Regression, LWLR) 思想:给待测点附近每一个点赋予一定的权重,在这个子集上基 阅读全文
posted @ 2022-09-14 13:34 酷酷的排球 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 集成算法(融合算法) 元算法(meta-algorithm) 思路:对其他算法进行组合。 使用集成算法时有多种形式: 不同算法的集成; 同一算法在不同设置下的集成; 数据集不同部分,分配给不同分类器之后的集成。 bagging(bootstrap aggregating) 自举汇聚法 定义:从原始数 阅读全文
posted @ 2022-09-13 17:56 酷酷的排球 阅读(226) 评论(0) 推荐(0) 编辑
摘要: SVM(Support Vector Machines) 支持向量机 引言 svm有很多的实现,此处介绍最流行的一种实现 序列最小化 SMO(Sequential Minimal Optimizaiton) 核函数(Kernel): 将SVM扩展到更多的数据集上 基于最大间隔分割数据 优点: 泛化错 阅读全文
posted @ 2022-08-25 17:39 酷酷的排球 阅读(79) 评论(0) 推荐(0) 编辑
摘要: LogisticRegression逻辑回归 引言: 机器学习 解决的问题,大体上分为两种 预测 和 分类。 预测: 一般采用是回归模型,比如最常用的 线性回归; 分类:采用的有 决策树,KNN, 支持向量机, 朴素贝叶斯等等模型。 其实本质上来讲是一样的,都是通过对已有数据的学习,构建模型,然后对 阅读全文
posted @ 2022-08-24 11:29 酷酷的排球 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 贝叶斯算法 引言 机器学习中,如KNN,逻辑回归,决策树等模型都是判别方法, 也就是直接学习出输出特征y和输入特征x之间的关系(决策函数:y = f(x) 或者条件分布P(Y|X))。 朴素贝叶斯是生成方法,直接找出输出特征y和输入特征x的联合分布P(X, Y),进而通过P(Y|X)=P(X, Y) 阅读全文
posted @ 2022-08-22 16:13 酷酷的排球 阅读(470) 评论(0) 推荐(0) 编辑
摘要: 决策树 概念 决策树(Decision Tree)是一种基本的分类与回归方法。决策树模型呈树形结构,在分类问题中,表示基于特征对数据进行分类的过程。它可以认为是if-then规则的集合。 优点: 1)可以自学习。在学习过程中不需要使用者了解过多的背景知识,只需要对训练数据进行较好的标注,就能进行学习 阅读全文
posted @ 2022-08-18 14:27 酷酷的排球 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 数组 二分法查找 前提 数组为有序数组; 数组中没有重复元素。 优点 逻辑简单 难点 涉及很多边界条件,对区间定义不清楚,二分法则容易写乱 解决方法: 原则: 循环不变量规则 二分查找中,保持区间不变量,在循环寻找中每一次边界的处理都要坚持区间的定义来操作, 方式: 左闭右闭 左闭右开 左闭右闭 第 阅读全文
posted @ 2022-08-16 15:05 酷酷的排球 阅读(57) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 11 下一页