05 2014 档案

摘要:最近在网上查看用MapReduce实现的Kmeans算法,例子是不错,http://blog.csdn.net/jshayzf/article/details/22739063但注释太少了,而且参数太多,如果新手学习的话不太好理解。所以自己按照个人的理解写了一个简单的例子并添加了详细的注释。大致的步... 阅读全文
posted @ 2014-05-23 18:59 潇洒子弦 阅读(15688) 评论(4) 推荐(6)
摘要:Hadoop技术内幕中指出Top K算法有两步,一是统计词频,二是找出词频最高的前K个词。在网上找了很多MapReduce的Top K案例,这些案例都只有排序功能,所以自己写了个案例。这个案例分两个步骤,第一个是就是wordCount案例,二就是排序功能。一,统计词频 1 package TopK;... 阅读全文
posted @ 2014-05-20 16:04 潇洒子弦 阅读(6280) 评论(2) 推荐(1)

我的邮箱:keepmovingzx@163.com