随笔分类 - 机器学习
摘要:1、关联规则原理 1、关联规则概述 关联规则(Association Rules)是反映一个事物与其他事物之间的相互依存性和关联性,如果两个或多个事物之间存在一定的关联关系,那么,其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术,用于从大量数据中挖掘出有价值的数据项之间的相关关系
阅读全文
摘要:1、元算法(集成算法) 元算法就是对其他算法进行组合的一种方式。也称为集成算法(ensemble method),例如bagging方法和boosting方法。它可以是不同算法的集成;也可以是同一算法在不同设置下的集成;还可以是数据集不同部分分配给不同分类器之后的集成。 2、bagging和boos
阅读全文
摘要:KNN是通过测量对象的不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数。 KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者
阅读全文
摘要:1、介绍 k-means算法以k为参数(所期望的簇的个数),把n个对象分成k个簇(单层划分),用质心(数据点的平均值)定义簇的原型。使得簇内具有较高的相似度,而簇间的相似度较低。 通过聚类,我们能够发现数据对象之间的关系。簇内的相似度越高,簇间的相似度越低,聚类效果越好。 2、过程 ①随机选择k个点
阅读全文
摘要:1、介绍 它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。 2、求解过程 1、数据分类—SVM引入 假设在一个二维平面中有若干数据点(x,y),其被分为2组,假设这些数据线性可分,则需要找到一条直线将
阅读全文
摘要:一、概念 决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点有两种类型:内部节点和叶节点,内部节点表示一个特征或属性,叶节点表示一个类别。 分类的时候,从根节点开始,对实例的某一个特征进行测试,根据测试结果,将实例分配到其子结点;此时,每一个子结点对应着该特征的一个取值。如
阅读全文
摘要:1、概率 1、条件概率 对于条件概率,我们有: 表示在b已知的情况下(条件)发生a的概率。 2、概率的乘法法则 3、独立事件同时发生的概率 2、贝叶斯定理 贝叶斯定理联系先验概率和后验概率: p(A|B)表示在B发生的情况下A发生的概率。 P(A)指先验概率;P(B|A)为似然函数,形式同条件概率;
阅读全文
摘要:一、可视化方法 二、交互式工具 三、Python IDE类型 四、交互式可视化软件包 五、统计与数据挖掘算法 1)分类问题 2)其他问题 六、深度学习 七、图模型/网络模型展示
阅读全文

浙公网安备 33010602011771号