cresports

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2014年5月6日

摘要: 简介Apache HBase是Hadoop的分布式开源的存储管理工具,非常适合随机实时的io操作。我们知道,Hadoop的Sequence File是一个顺序读写,批量处理的系统。但是为什么HBase能做到随机的,实时的io操作呢?Hadoop底层使用Sequence File文件格式存储,Sequ... 阅读全文
posted @ 2014-05-06 15:05 cresports 阅读(445) 评论(0) 推荐(0)

2014年4月25日

摘要: hadoop中的SequenceFile提供了一种持久存储二进制k-v键值对的数据结构。和B-tree不同,SequenceFile不能支持对指定key的修改,增加或删除。整个文件只能以追加的方式写入数据。SequenceFile有三种存储格式:非压缩格式,记录压缩格式和分块压缩格式;每种格式都包含... 阅读全文
posted @ 2014-04-25 19:01 cresports 阅读(1264) 评论(0) 推荐(1)