摘要: 注:本文翻译自http://www.cyanny.com/2013/12/05/hadoop-isnt-silver-bullet/Hadoop是一个分布式海量数据计算的伟大框架。但是,hadoop并不是万能的。比如,以下场景就不适合用hadoop:1、低延迟数据访问 需要实时查询并在毫秒级内进行低延时访问数据就不适合用hadoop。Hadoop并不适用于数据库。数据库的索引记录可降低延时的时间,提高响应的速度。但是,如果你在数据库这方面确实有实时查询的需求,可以尝试一下HBase,这是一个适合随机访问和实时读写的列式数据库。2、结构化的数据 Hadoop不适用于处理关联紧密的结构化数据,.. 阅读全文
posted @ 2014-02-22 23:06 youngxiaobin 阅读(389) 评论(0) 推荐(0) 编辑
摘要: 一、简介 hbase是hadoop中的数据库,是一个高可靠、高性能、面向列、可伸缩的分别是存储系统,利用hbase技术可在廉价的PC Server上搭建起大规模的结构化存储集群。 hbase是google bigtable的开源实现,类似google bigtable利用GFS作为其文件存储系统,hbase利用hadoop的hdfs作为它的文件存储系统;google运行MapReduce来处理bigtable的海量数据,同样的,hbase也利用hadoopMR来处理hbase中的海量数据;google bigtable 利用chubby作为协同服务,hbase利用zookeeper作为对应.. 阅读全文
posted @ 2013-12-15 21:54 youngxiaobin 阅读(247) 评论(0) 推荐(0) 编辑