摘要:
一、impala存储1、文件类型2、压缩方式二、impala分区1、创建分区方式partitioned by 创建表时,添加该字段指定分区列表:create table t_person(id int, name string, age int) partitioned by (type string);使用alter table 进行分区的添加和删除操作:alter table t_person... 阅读全文
posted @ 2019-12-04 14:20
米兰的小铁將
阅读(1944)
评论(0)
推荐(0)
摘要:
一、概述Impala 是参照google 的新三篇论文Dremel(大批量数据查询工具)的开源实现,功能类似shark(依赖于hive)和Drill(apache),impala 是clouder 公司主导开发并开源,基于hive并使用内存进行计算,兼顾数据仓库,具有实时,批处理,多并发等优点。是使用cdh 的首选PB 级大数据实时查询分析引擎。(也可以单独安装使用,但一般都是和CDH一起使用;)... 阅读全文
posted @ 2019-12-04 11:17
米兰的小铁將
阅读(2514)
评论(0)
推荐(0)

浙公网安备 33010602011771号