打赏

Hadoop HBase概念学习系列之HBase里的长表VS宽表VS窄表(十五)

  有时候啊,HBase表的设计方案通常,还会考虑如下一些因素,当然,这只是考虑范围里的部分呢。

  更多的行还是更多的版本?后者使用了HBase自带的功能。但是需要在列簇中定义最大版本数,这样做可能有风险。最好的做法是版本使用多行存储,这需要把时间戳作为行键的一部分,数据检索模式定义了时间戳如何定义为行键的一部分以及应该位于行键的一部分。

  更多行或是每行包含更多列?HBase支持每行包含数百万列,并且每一列都可以有列标识。

  以行为列的设计?这是一种介于多行和多列的折衷方案。我们可以举一个日志数据库的例子,这个数据库中存储了所有系统中机器生成的日志。我们可以将系统标识(产生日志的系统)和时间范围(比如间隔15分钟)联合起来定义行,每一列代表一种日志事件。

  

posted @ 2016-12-07 11:15  大数据和AI躺过的坑  阅读(2996)  评论(0编辑  收藏  举报