2012年4月9日
摘要: 聚类分析计算方法主要有如下几种:1. 划分法(partitioning methods) 给定一个有N个元组或者纪录的数据集,分裂法将构造K个分组,每一个分组就代表一个聚类,K<N。而且这K个分组满足下列条件:(1) 每一个分组至少包含一个数据纪录;(2)每一个数据纪录属于且仅属于一个分组(注意:这个要求在某些模糊聚类算法中可以放宽);对于给定的K,算法首先给出一个初始的分组方法,以后通过反复迭代的方法改变分组,使得每一次改进之后的分组方案都较前一次好,而所谓好的标准就是:同一分组中的记录越近越好,而不同分组中的纪录越远越好。使用这个基本思想的算法有:K-MEANS算法、K-MEDOID 阅读全文
posted @ 2012-04-09 09:47 yangrui099 阅读(6188) 评论(0) 推荐(0)
摘要: 一.系统聚类法1.基本思想将模式样本按距离准则逐步分类,类别由多到少,直到获得合适的分类要求为止。算法:第一步:设初始模式样本共有N个,每个样本自成一类,即建立N类,。计算各类之间的距离(初始时即为各样本间的距离),得到一个N*N维的距离矩阵D(0)。这里,标号(0)表示聚类开始运算前的状态。第二步:假设前一步聚类运算中已求得距离矩阵D(n),n为逐次聚类合并的次数,则求D(n)中的最小元素。如果它是Gi(n)和Gj(n)两类之间的距离,则将Gi(n)和Gj(n)两类合并为一类,由此建立新的分类:。第三步:计算合并后新类别之间的距离,得D(n+1)。计算与其它没有发生合并的之间的距离,可采用多 阅读全文
posted @ 2012-04-09 09:42 yangrui099 阅读(19513) 评论(0) 推荐(2)
  2012年3月28日
摘要: http://blog.sina.com.cn/s/blog_627a4f560100xmj1.html在机器学习(Machine learning)领域,监督学习(Supervised learning)、非监督学习(Unsupervised learning)以及半监督学习(Semi-supervised learning)是三类研究比较多,应用比较广的学习技术,wiki上对这三种学习的简单描述如下:监督学习:通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,例如分类。非监督学习:直接对输入数据集进行建模,例如聚类。半监督学习:综合利用有类标的数据和没 阅读全文
posted @ 2012-03-28 13:56 yangrui099 阅读(6650) 评论(2) 推荐(2)
  2012年3月18日
摘要: 本文介绍了基于复杂网络的自动文本摘要的方法。 具体分为四步骤: 1 将文章进行预处理,根据句子分隔符将句子分开,并将名词提取出。 2 根据文章构建成两个N*N的矩阵,一个是表示邻接关系的矩阵,一个是表示权重的矩阵,分别叫做A和W,N为句子的个数。 3 计算节点的值 4 根据一定的算法将句子进行排序,然后取出前n个句子组成摘要。 文中提出了7种网络测量的算法和14中句子排序算法,具体介绍如下: 1Degree strategies: CN-Degree and CN-Strength 根据与节点i相连的节点的个数作为节点i的值,即Ki = ∑aij,aij为矩阵A中的元素... 阅读全文
posted @ 2012-03-18 14:48 yangrui099 阅读(509) 评论(0) 推荐(0)
  2012年3月16日
该文被密码保护。 阅读全文
posted @ 2012-03-16 10:15 yangrui099 阅读(0) 评论(0) 推荐(0)
  2012年3月15日
该文被密码保护。 阅读全文
posted @ 2012-03-15 12:09 yangrui099 阅读(1) 评论(0) 推荐(0)
  2012年3月14日
该文被密码保护。 阅读全文
posted @ 2012-03-14 16:03 yangrui099 阅读(1) 评论(0) 推荐(0)
  2012年3月12日
该文被密码保护。 阅读全文
posted @ 2012-03-12 17:24 yangrui099 阅读(3) 评论(0) 推荐(0)
该文被密码保护。 阅读全文
posted @ 2012-03-12 14:23 yangrui099 阅读(4) 评论(0) 推荐(0)
  2012年3月8日
该文被密码保护。 阅读全文
posted @ 2012-03-08 10:44 yangrui099 阅读(0) 评论(0) 推荐(0)