摘要: 转载的地址:http://blog.csdn.net/heavendai/article/details/7029465Clustering 中文翻译作“聚类”,简单地说就是把相似的东西分到一组,同 Classification (分类)不同,对于一个 classifier ,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个 classifier 会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通常叫做supervised learning (监督学习),而在聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西 阅读全文
posted @ 2012-11-08 15:19 书画还家 阅读(188) 评论(0) 推荐(0) 编辑
摘要: 原文地址:http://www.cnblogs.com/seacode/archive/2011/03/09/1979246.htmlknn的思想比较简单,从训练样本中找出K个与其最相近的样本,然后看这k个样本中哪个类别的样本多,则待判定的值(或说抽样)就属于这个类别。公式表示为:1,对所有的样本求距离 ,然后选出K个最近的2,从这k个样本中找出含有样本最多的所属类别:缺点:1,k值需要预先设定,而不能自适应。2 当样本不平衡时,如一个类的样本容量很大,而其他类样本容量很小时,有可能导致当输入一个新样本时,该样本的K个邻居中大容量类的样本占多数。如下图:,绿色圆要被决定赋予哪个类,是红色三角形 阅读全文
posted @ 2012-11-08 15:14 书画还家 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 原文地址:http://www.cnblogs.com/heaad/archive/2010/12/23/1914725.html作者还有自己原创的代码,觉得这个作者讲的很好,很清楚。遗传算法 ( GA , Genetic Algorithm ) ,也称进化算法 。 遗传算法是受达尔文的进化论的启发,借鉴生物进化过程而提出的一种启发式搜索算法。因此在介绍遗传算法前有必要简单的介绍生物进化知识。一.进化论知识 作为遗传算法生物背景的介绍,下面内容了解即可: 种群(Population):生物的进化以群体的形式进行,这样的一个群体称为种群。 个体:组成种群的单个生物。 基因 ( Gene ... 阅读全文
posted @ 2012-11-08 15:02 书画还家 阅读(160) 评论(0) 推荐(0) 编辑