数据挖掘（Data Mining） - 随笔分类 - karying

通过K-MEDOIDS算法对时间序列进行聚类的实现

摘要：通过K-MEDOIDS算法对时间序列进行聚类的实现阅读全文

posted @ 2011-04-09 23:32 karying 阅读(2492) 评论(0) 推荐(1)

DTW（Dynamic Time Warping，动态时间归整）的介绍

摘要：在日常的生活中我们最经常使用的距离毫无疑问应该是欧式距离，但是对于一些特殊情况，欧氏距离存在着其很明显的缺陷，比如说时间序列，举个比较简单的例子，序列A：1,1,1,10,2,3，序列B：1,1,1,2,10,3，如果用欧氏距离，也就是distance[i][j]=(b[j]-a[i])*(b[j]-a[i])来计算的话，总的距离和应该是128，应该说这个距离是非常大的，而实际上这个序列的图像是十分相似的，这种情况下就有人开始考虑寻找新的时间序列距离的计算方法，然后提出了DTW算法，这种方法在语音识别，机器学习方便有着很重要的作用。这个算法是基于动态规划（DP）的思想，解决了发音长短不一的模板阅读全文

posted @ 2011-03-12 17:44 karying 阅读(4409) 评论(0) 推荐(0)

K-MEANS算法的C++实现

摘要：#include <stdio.h>#include <stdlib.h>#include <math.h>#define NA 4 /* 数据维数 */#define K 3 /* 聚类数 */#define Psize 50 /* 种群大小 */#define T 30 /* 最大迭代数 */#define ED 0.0000001 /* 结束条件 */typedef struct { double p[NA]; double distance[K];}Point;typedef struct { Point clu_cent[K]; /* 即clust 阅读全文

posted @ 2010-12-09 11:30 karying 阅读(1099) 评论(0) 推荐(1)

K-means 简介

摘要：Kmeans算法 k-means 算法接受输入量 k ；然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”（引力中心）来进行计算的。编辑本段算法流程首先从n个数据对象任意选择 k 个对象作为初始聚类中心；而对于所剩下其它对象，则根据它们与这些聚类中心的相似度（距离），分别将它们分配给与其最相似的（聚类中心所代表的）聚类；然后再计算每个所获新聚类的聚类中心（该聚类中所有对象的均值）；不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类阅读全文

posted @ 2010-12-09 10:45 karying 阅读(311) 评论(0) 推荐(0)

随笔分类 - 数据挖掘（Data Mining）

通过K-MEDOIDS算法对时间序列进行聚类的实现

DTW（Dynamic Time Warping，动态时间归整）的介绍

K-MEANS算法的C++实现

K-means 简介

导航

公告