大数据自学4-Hue集成环境中各模组说明

前面已经学习了如何将数据从关系型数据库导入到Hive/HDFS,并且在Windows客户端查询导入的数据,接下来继续学习CDH,知识点:

1、Hue环境中DB Query如何使用,DB Query这个功能是在Hue这个Web界面可以直接查询其他关系型数据库的数据,Hue在默认装完后是无法直接使用DB Query的,需要配置,详细可参照http://www.cnblogs.com/qingyunzong/p/9487952.html

2、Impapa,又一个新名词,百度了一下其实这个还比较易学,只是Cloudera公司主导开发的新型查询系统而已,语法同SQL类似,可以直接直接Hive数据库中的数据,由于是和Hive共享元数据,因此需要同步元数据

3、Pig,光说Pig会让人误会是小猪,还是叫全称吧-Apache Pig,Pig有一个Latin语言,使用该语言可以很容易实现MapReduce任务,简而言之,Pig的出现也是想让更多的人无需写代码就可以快速实现MapReduce。

posted @ 2018-11-27 10:11  大海胸懷  阅读(400)  评论(0编辑  收藏  举报