会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
紫杉
博客园
::
首页
::
新随笔
::
联系
::
订阅
::
管理
::
公告
2014年7月16日
Hive 查询优化总结
摘要: 一、join优化Join查找操作的基本原则:应该将条目少的表/子查询放在Join操作符的左边。原因是在Join操作的Reduce阶段,位于Join操作符左边的表的内容会被加载进内存,将条目少的表放在左边,可以有效减少发生内存溢出错误的几率。Join查找操作中如果存在多个join,且所有参与join的...
阅读全文
posted @ 2014-07-16 16:33 紫杉
阅读(349)
评论(0)
推荐(0)
Hive调优实战
摘要: Hive优化总结---by 食人花优化时,把hive sql当做map reduce程序来读,会有意想不到的惊喜。理解hadoop的核心能力,是hive优化的根本。这是这一年来,项目组所有成员宝贵的经验总结。长期观察hadoop处理数据的过程,有几个显著的特征:1.不怕数据多,就怕数据倾斜。2.对j...
阅读全文
posted @ 2014-07-16 16:32 紫杉
阅读(260)
评论(0)
推荐(0)