Hbase
1.hive就是MR;hbase大量数据存在hdfs,少量存在内存中。
2.开源的,非关系型数据库(Nosql),运行在hdfs系统之上,因此可以容错存储海量稀疏的数据。什么是稀疏的数据呢?有些字段是空的,你不能保证每个key的value都有数据。
3.hbase特性:面向列。
对于数据库存储分为2种情况:
行存储:传统关系型数据库是行存储,优点:写入的时候一次性完成,保证数据的完整性。 缺点:读的时候会产生很多的冗余数据,
列存储:nosql ,优点:读取过程,不会产生冗余数据,特别适合对数据完整性不高的大数据领域。缺点:写入效率差,没办法保证数据的完整性。
4.hbase的优势:海量数据的存储;快速随、机访问;大量写操作;
5.hbase应用场景:
6.hbase数据模型:Rowkey、Column Family(列族)、Column(属于某一个列族,子列称为:column qualifier 也就是CF下可以分成多个子列)
物理模型是支撑数据模型的实现
hbase中的一张表是由一个或多个Hregion(区域、分区)组成
7.hbase是行锁定
8.hbase物理模型:
表-》htable

浙公网安备 33010602011771号