残雪余香

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2013年11月27日

摘要: 一直对行式存储和列式存储理解不是很好,这篇文章介绍了行式存储和列式存储的区别,总结得非常好。一句话解释就是:行式存储就是将一行的数据中的所有列存储在一起,列式存储就是将一列上所有行的数据存放在一起。 阅读全文
posted @ 2013-11-27 15:27 残雪余香 阅读(466) 评论(0) 推荐(0)

摘要: 引自:http://blog.csdn.net/xhanfriend/article/details/8434896对于数据分析师来说,SQL是主要的语言。 Hive为Hadoop提供了支持SQL运行的能力,可是目前Hive运行速度达不到实时要求。这是因为Hive将SQL翻译成一个或多个MapReduce任务,而MapReduce原本是大数据批处理计算框架,并不适应实时数据分析的速度要求。现在有两种思路去提高SQL在大数据平台上的执行速度:1.用一种更快的SQL执行引擎取代MapReduce。2.优化MapReduce,使其更适合OLAP查询。谷歌在这两种思路上都做出了先驱性工作。2010年, 阅读全文
posted @ 2013-11-27 15:05 残雪余香 阅读(1206) 评论(0) 推荐(0)