分布式HBase-0.98.4环境搭建
摘要:fesh个人实践,欢迎经验交流!Blog地址:http://www.cnblogs.com/fesh/p/3804072.html 本文有点简单,详细版本请参见《分布式Hbase-0.98.4在Hadoop-2.2.0集群上的部署》 Hbase是一个分布式,版本化(versioned),构建...
阅读全文
Mahout源码分析之 -- 文档向量化TF-IDF
摘要:fesh个人实践,欢迎经验交流!Blog地址:http://www.cnblogs.com/fesh/p/3775429.html Mahout之SparseVectorsFromSequenceFiles源码分析一、原理TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一...
阅读全文
Ubuntu12.04-x64编译Hadoop2.2.0和安装Hadoop2.2.0集群
摘要:Ubuntu12.04-x64编译安装Hadoop2.2.0集群、Hadoop-Eclipse插件
阅读全文