Hbase

1.hive就是MR;hbase大量数据存在hdfs,少量存在内存中。

2.开源的,非关系型数据库(Nosql),运行在hdfs系统之上,因此可以容错存储海量稀疏的数据。什么是稀疏的数据呢?有些字段是空的,你不能保证每个key的value都有数据。

3.hbase特性:面向列。

  对于数据库存储分为2种情况:   

  行存储:传统关系型数据库是行存储,优点:写入的时候一次性完成,保证数据的完整性。 缺点:读的时候会产生很多的冗余数据,             

  列存储:nosql ,优点:读取过程,不会产生冗余数据,特别适合对数据完整性不高的大数据领域。缺点:写入效率差,没办法保证数据的完整性。

4.hbase的优势:海量数据的存储;快速随、机访问;大量写操作;

5.hbase应用场景:

6.hbase数据模型:Rowkey、Column Family(列族)、Column(属于某一个列族,子列称为:column qualifier    也就是CF下可以分成多个子列)

物理模型是支撑数据模型的实现

hbase中的一张表是由一个或多个Hregion(区域、分区)组成

7.hbase是行锁定

8.hbase物理模型:

表-》htable

 

posted @ 2017-11-23 11:03  hubophp  阅读(197)  评论(0)    收藏  举报