hbase学习一

  1. 什么是HBase?
    HBase是一个基于HDFS的、分布式、可扩展、面向列的NoSQL数据库。它起源于Google的BigTable论文,是Apache Hadoop生态系统的重要组成部分,专门用于处理海量数据的随机、实时读写访问。

  2. 为什么需要HBase?
    Hadoop HDFS适合批处理,但无法进行随机读写。MapReduce适合离线计算,但延迟高。HBase的出现弥补了这些不足:

高吞吐量和低延迟:支持毫秒级的随机读写访问。

强大的水平扩展能力:通过简单地增加RegionServer节点来扩展容量和性能。

高容错性:数据自动冗余,自动Region迁移。

稀疏表存储:适合存储半结构化和非结构化数据。

  1. 核心特性
    强一致性读写

自动分片(Auto-Sharding)

自动RegionServer故障转移

与Hadoop/HDFS无缝集成

支持BlockCache和BloomFilter等高效查询优化

posted @ 2025-09-18 12:54  vivi_vimi  阅读(11)  评论(0)    收藏  举报