Impala的特点

Impala的特点

0. 原理

基于内存的分析框架.

1.为什么会有Impala?

hive进行计算太慢了,于是就有了Impala,Impala可以理解为是hive的内存版本.

2.Impala的优点.

  1. hive的升级版本,完全基于内存计算
  2. 会hive 就会Impala

3.什么时候可以用Impala?

当要计算的数据量小于内存时,并且使用频率非常高的,经常要看的数据,而且是变化的数据.

比如说,临时性的需求,最近几天要看的数据,以后又不一定要的数据,这个时候,你不可能去写个spark程序看结果,你要是用hive的话,计算又太慢了.就可以用Impala.

4. Impala的缺点

  1. 完全依赖内存,就是说计算的数据量不能大于内存

5.什么时候不可以用Impala?

不是特别紧急的结果,就不要用Impala.

数据量大于内存的时候,就不要用Impala

posted @ 2020-11-17 16:23  宁君  阅读(281)  评论(0编辑  收藏  举报