随笔分类 -  数据挖掘算法

摘要:数据挖掘领域一直都非常的火。现在炒的非常热的大数据,其实也是数据挖掘的一个应用而已,不管工程师用的是Hadoop还是其他平台,其实都是对一堆的数据进行分析,计算,然后得到我们希望得到的结果。所以我们可以知道,文本数据挖掘的必要性是因为信息技术,特别是网络的频繁使用,自媒体的越来越多,从大海中找到同一 阅读全文
posted @ 2014-06-19 10:35 白来了123 阅读(6109) 评论(8) 推荐(5)
摘要:系列文章:数据挖掘算法之决策树算法 k-means算法可以说是数据挖掘中十大经典算法之一了,属于无监督的学习。该算法由此衍生出了很多类k-means算法,比如k中心点等等,在数据挖掘领域,很多地方都会用到该算法,他能够把相似的一类很好的聚在一起。一类指的是,他们之间的相似度较高,计算相似度的常用度量 阅读全文
posted @ 2014-04-29 10:55 白来了123 阅读(3131) 评论(13) 推荐(8)
摘要:系列文章:数据挖掘算法之k-means算法 [QQ群: 189191838,对算法和C++感兴趣可以进来] 今天主要讲到的是决策树算法,这是一种非常经典的分类算法,经过数据集的训练,能够高效的判断出一个数据项所属的类别。 决策树算法是一种有监督的学习,也就是说会事先给定一定类别和数据集合。... 阅读全文
posted @ 2014-04-28 13:28 白来了123 阅读(7920) 评论(77) 推荐(43)