摘要: 一、hive的压缩 1. hadoop的压缩 1)为什么需要压缩 MapReduce的性能瓶颈:网络IO、磁盘IO 数据量:对于MapReduce的优化,最主要、根本就是要能够减少数据量 Combiner:减少跨网络传输的数据量 压缩:将数据量减少,但是需要消耗CPU计算功能 2)哪些地方可以压缩 阅读全文
posted @ 2016-07-31 09:43 沙漏哟 阅读(249) 评论(0) 推荐(0)