随笔分类 -  数据挖掘(Data Mining)

通过K-MEDOIDS算法对时间序列进行聚类的实现
摘要:通过K-MEDOIDS算法对时间序列进行聚类的实现 阅读全文

posted @ 2011-04-09 23:32 karying 阅读(2485) 评论(0) 推荐(1)

DTW(Dynamic Time Warping,动态时间归整)的介绍
摘要:在日常的生活中我们最经常使用的距离毫无疑问应该是欧式距离,但是对于一些特殊情况,欧氏距离存在着其很明显的缺陷,比如说时间序列,举个比较简单的例子,序列A:1,1,1,10,2,3,序列B:1,1,1,2,10,3,如果用欧氏距离,也就是distance[i][j]=(b[j]-a[i])*(b[j]-a[i])来计算的话,总的距离和应该是128,应该说这个距离是非常大的,而实际上这个序列的图像是十分相似的,这种情况下就有人开始考虑寻找新的时间序列距离的计算方法,然后提出了DTW算法,这种方法在语音识别,机器学习方便有着很重要的作用。这个算法是基于动态规划(DP)的思想,解决了发音长短不一的模板 阅读全文

posted @ 2011-03-12 17:44 karying 阅读(4392) 评论(0) 推荐(0)

K-MEANS算法的C++实现
摘要:#include <stdio.h>#include <stdlib.h>#include <math.h>#define NA 4 /* 数据维数 */#define K 3 /* 聚类数 */#define Psize 50 /* 种群大小 */#define T 30 /* 最大迭代数 */#define ED 0.0000001 /* 结束条件 */typedef struct { double p[NA]; double distance[K];}Point;typedef struct { Point clu_cent[K]; /* 即clust 阅读全文

posted @ 2010-12-09 11:30 karying 阅读(1098) 评论(0) 推荐(1)

K-means 简介
摘要:Kmeans算法 k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。编辑本段算法流程 首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类 阅读全文

posted @ 2010-12-09 10:45 karying 阅读(303) 评论(0) 推荐(0)

导航