摘要:
1.Cascading:Cascading是基于Hadoop集群之上的数据处理API。它通过实现了丰富的功能化API,使你不需要接触MapReduce任务就能使用分布式计算能力,其核心概念是基于管道和流的数据处理。2.Mahout:Mahout是一个基于Hadoop实现各种机器学习与数据挖掘算法库。被用来提供推荐服务。3.Hive:Hive由Facebook出品,它为Hadoop提供了一种类似于SQL的操作接口。4.Avro:Avro是一个基于二进制数据传输高性能的中间件。Avro通过将数据进行序列化,以使得大批量数据交互过程更方便。5.Storm:Storm由BackType Technol 阅读全文
posted @ 2013-03-22 11:45
jenliy
阅读(460)
评论(0)
推荐(0)
摘要:
阅读全文
posted @ 2013-03-22 10:39
jenliy
阅读(110)
评论(0)
推荐(0)

浙公网安备 33010602011771号