摘要: 粘贴一下我在部门中的一次hive优化的分享。 简述 hive构建在hadoop基础上,利用分布式存储,通过mr引擎实现对大数据的计算。MR会频繁地读写磁盘而且MR任务的启动成本很高。对于hive优化显得尤为重要。而优化的核心就是更好地利用hadoop的分布式特性和hive的有点。本篇从IO、参数设置 阅读全文
posted @ 2018-06-29 18:37 999.感冒灵 阅读(749) 评论(0) 推荐(0) 编辑