代码改变世界

文章分类 -  Hadoop等大数据产品

Pig -- 基于Hadoop的轻量级大规模数据分析工具

2014-12-10 10:00 by hduhans, 1779 阅读, 收藏,
摘要: Pig是Apache项目的一个子项目,提供了一个支持大规模数据分析的平台。基于Hadoop的大规模数据分析工具,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig是一种描述性编程语言,比Hive轻量,... 阅读全文

将hadoop源码关联到eclipse项目中

2014-10-13 18:21 by hduhans, 281 阅读, 收藏,
摘要: 将hadoop源码关联到eclipse项目中可以方便分析其源码结构,便于学习!下面是操作步骤(hadoop版本1.1.2,+myeclipse):1、在eclipse中新建一个Java Project,如图1-1所示。图1-1 新建java工程2、将hadoop解压后src文件夹中的core、h... 阅读全文

Hadoop之RPC通信

2014-08-09 17:17 by hduhans, 308 阅读, 收藏,
摘要: RPC(remote procedure call protocol),远程过程调用协议,是hadoop框架运行的基础。这里的远程并不是指距离上的远,而是指不同java进程间的对象方法的调用。调用的发生在服务端执行,客户端只获取结果。 服务端提供的对象必须是一个接口,并且extends Ver... 阅读全文