随笔分类 -  大数据

大数据知识收集
摘要:Hbase 表的特点: 大,一个表可以有数十亿行,上百万列(海量数据)。 无模式,每行都有一个可排序的主键和任意多的列,列可以根据需要动态增加,同一张表不同的行可以有截然不同的列。 面向列,面向列的存储和权限控制,列独立检索。 稀疏,空列(null)不会占用存储空间,表可以设计得非常稀疏。 数据多版本,每个单元中的数据可以有多个版本,默认情况下版本号自动分配,是单元... 阅读全文
posted @ 2016-05-05 11:40 onionch 阅读(129) 评论(0) 推荐(0)
摘要:架构一 组件说明: 1,Client: 是Hbase的入口,增删改查都是从这里开始,对外提供一系列API 跟Zookeeper交互的目的是为了获取Region信息(老版本的ROOT—Meta 新版本里只有Meta),获得到了这个信息以后(会缓存起来,避免频繁跑到zookeeper来获取这些信息),就直接奔向Region Server,进行数据的增删改查。 Client ... 阅读全文
posted @ 2016-05-04 21:59 onionch 阅读(153) 评论(0) 推荐(0)