摘要:
1、Impala简介 • Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。 • 基于Hive使用内存计算,兼顾数据仓库、具有实时、批处理、多并发等优点 • 是CDH平台首选的PB级大数据实时查询分析引擎 官网:http://www.cloudera.c 阅读全文
posted @ 2017-08-02 18:43
HackerVirus
阅读(1398)
评论(0)
推荐(0)
摘要:
Hadoop HBase协处理器 摘要: 说明:类似于RDBMS中触发器,允许用户在region服务器上运行自己的代码,在客户端用户不用关心操作具体在哪进行使用场景:权限控制,回调函数(钩子函数)、扫描统计等主要类:observer和endpointobserver:类似触发器,回调函数在特定事件发 阅读全文
posted @ 2017-08-02 18:39
HackerVirus
阅读(229)
评论(0)
推荐(0)
摘要:
sqoop工具从oracle导入数据 sqoop工具是hadoop下连接关系型数据库和Hadoop的桥梁,支持关系型数据库和hive、hdfs,hbase之间数据的相互导入,可以使用全表导入和增量导入 从RDBMS中抽取出的数据可以被MapReduce程序使用,也可以被类似Hive的工具使用;得到分 阅读全文
posted @ 2017-08-02 18:33
HackerVirus
阅读(442)
评论(0)
推荐(0)
摘要:
使用sqoop将oracle数据导入hdfs集群 集群环境: hadoop1.0.0 hbase0.92.1 zookeeper3.4.3 hive0.8.1 sqoop-1.4.1-incubating__hadoop-1.0.0.tar 首先,当然前提是Hadoop集群环境已经搭建好了。如没有搭 阅读全文
posted @ 2017-08-02 18:25
HackerVirus
阅读(1485)
评论(0)
推荐(0)