随笔分类 -  数据挖掘&机器学习

摘要:特征演化的数据流 数据流学习是近年来机器学习与数据挖掘领域的一个热门的研究方向,数据流的场景和静态数据集的场景最大的一个特点就是数据会发生演化,关于演化数据流的研究大多集中于概念漂移检测(有监督学习),概念/聚类演化分析(无监督学习),然而,人们往往忽略了一个经常出现的演化场景:特征演化。大多数研究 阅读全文
posted @ 2019-11-22 15:56 PJQOOO 阅读(921) 评论(0) 推荐(2)
摘要:Clustering 聚类 密度聚类——DBSCAN 前面我们已经介绍了两种聚类算法:k-means和谱聚类。今天,我们来介绍一种基于密度的聚类算法——DBSCAN,它是最经典的密度聚类算法,是很多算法的基础,拥有很多聚类算法不具有的优势。今天,小编就带你理解密度聚类算法DBSCAN的实质。 DBS 阅读全文
posted @ 2019-11-14 10:03 PJQOOO 阅读(9626) 评论(0) 推荐(2)
摘要:Clustering 聚类 谱聚类 上文我们引入了是聚类,并介绍了第一种聚类算法K-means。今天,我们来介绍一种流行的聚类算法——谱聚类(Spectral Clustering),它的实现简单,而且效果往往好于传统的聚类算法,如k-means,但是其背后的原理涉及了很多重要而复杂的知识,如图论, 阅读全文
posted @ 2019-11-12 08:52 PJQOOO 阅读(3099) 评论(1) 推荐(1)
摘要:Clustering 聚类K-means 聚类是机器学习和数据挖掘领域的主要研究方向之一,它是一种无监督学习算法,小编研究生时期的主要研究方向是“数据流自适应聚类算法”,所以对聚类算法有比较深刻的理解,于是决定开一个专题来写聚类算法,希望可以为入门及研究聚类相关算法的读者带来帮助。聚类可以作为一个单 阅读全文
posted @ 2019-11-09 14:07 PJQOOO 阅读(1070) 评论(0) 推荐(0)
摘要:好文!http://blog.csdn.net/v_july_v/article/details/7624837 阅读全文
posted @ 2017-07-16 15:12 PJQOOO 阅读(233) 评论(2) 推荐(0)
摘要:注:此博文只是自己总结的笔记,参考很很多大牛的博客。 决策树算法之ID3算法 1.奥卡姆剃刀: 若有多个假设和观察值一致,则选择简单的那个。(be simple) 2.算法核心思想: 期望信息越小,信息增益越大,从而纯度越高。ID3算法以信息增益为度量选择,选择分裂后信息增益最大的属性进行分裂。所以 阅读全文
posted @ 2017-07-16 14:23 PJQOOO 阅读(446) 评论(0) 推荐(0)
摘要:梯度下降法 ​ 下面的h(x)是要拟合的函数,J(θ)损失函数,theta是参数,要迭代求解的值,theta求解出来了那最终要拟合的函数h(θ)就出来了。其中m是训练集的记录条数,j是参数的个数。 梯度下降法流程: (1)先对θ随机赋值,可以是一个全零的向量。 (2)改变θ的值,使J(θ)按梯度下降 阅读全文
posted @ 2017-07-16 14:20 PJQOOO 阅读(428) 评论(0) 推荐(0)
摘要:第一章.方法概论 <! more 1.监督学习:对任意给定输入,对其相应的输出做一个好的预测。 2.回归问题:输入变量与输出变量都为连续变量的预测问题。 ​ 分类问题:输入变量为有限个离散变量的预测问题。 ​ 标注问题:输入输出变量均为变量序列的预测问题。 3.概率模型: 由条件概率分布P(Y|X) 阅读全文
posted @ 2017-07-16 14:18 PJQOOO 阅读(543) 评论(0) 推荐(0)