• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
皇图霸业谈笑间
更高、更快、更强
博客园    首页    新随笔    联系   管理    订阅  订阅
谈谈hive和hbase的那些事

hive和hbase都是基于hadoop的架构之上使用hadoop作为底层存储。
hive是作为分布式数据仓库
hbase是作为分布式数据库
hive还是借用hadoop的MapReduce来完成一些hive中的命令的执行
hbase与hive都是单独安装的


hive用来批量处理数据,HBase用来快速索引数据。

hive是为了简化编写MapReduce程序而生的,hive本身不存储和计算数据,他完全依赖HDFS和mapreduce,hive中表纯逻辑表,就是表的基本定义和表的元数据

hbase为查询而生,他通过组织节点内所有机器的内存,提供一个超大的内存hash表,他需要组织自己的数据结构,包括磁盘和内存中的数据,而hive是不做这些工作的,表在hbase中是物理表,而不是逻辑表,搜索引擎用他来存储索引,以满足查询的实时性需求。

hbase的索引文件建立方式是个缺陷

hive的索引文件扩展却是个缺陷

 

 

 

 

 
posted on 2013-04-08 14:40  布颜书  阅读(341)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3