随笔分类 - Hbase
摘要:HBase简介 HBase是一个分布式的、面向列的开源数据库存储系统,是对Google论文BigTable的实现,具有高可靠性、高性能和可伸缩性,它可以处理分布在数千台通用服务器上的PB级的海量数据。BigTable的底层是通过GFS(Google文件系统)来存储数据,而HBase对应的则是通过HD
阅读全文
摘要:前面和大家分享了一些HBase入门基础知识。HBase作为一个数据库,在使用中无外乎增删改查操作,这些操作在HBase中都是和RowKey紧密相关的,所以优秀的RowKey设计方案是非常重要的。今天就来说说如何进行HBase的RowKey的设计。 RowKey的作用 RowKey在查询中的作用 HB
阅读全文
摘要:随着大数据的越来越普及,HBase也变得越来越流行。使用HBase并不困难,但是如何用好HBase,这确是一个难点。为了合理地使用HBase,尽可能发挥HBase的功能,我们需要根据不同的场景对HBase进行不同地优化以最大程度上提升系统的性能。本文重点介绍列族设计有关的优化。我们先来了解下HBas
阅读全文
摘要:Region的迁移和合并 Region的拆分 Region的合并 Region冷合并 Region热合并 Region的拆分 随着大合并的增多,一个region越来越大,造成数据的存储不平衡,访问速度也会变慢。 所以,当region达到一定大小(默认10G),region会先下线,一分为二,分为两个
阅读全文
摘要:一个系统上线之后,开发和调优将会一直伴随在系统的整个生命周期中,HBase也不例外。下面我们要学习如何进行HBase读写性能调优,以获取最大的读写效率。 HBase写入优化客户端优化批量写采用批量写,可以减少客户端到RegionServer之间的RPC的次数,提高写入性能。批量写请求要么全部成功返回
阅读全文
摘要:1.hbase的特点是什么? 答:1)hbase是一个分布式的,基于列式存储的数据库,基于hadoop的hdfs存储,zookeeper进行管理。 2)hbase 适合存储半结构化或非结构化的数据,对于数据结构字段不够确定或者杂乱无章很难按照一个概念去抽取的数据。 3)hbase为null的数据不会
阅读全文
浙公网安备 33010602011771号