2017年2月28日
摘要: 1、调节reduce端缓冲区大小避免OOM异常 1.1 为什么要调节reduce端缓冲区大小 对于map端不断产生的数据,reduce端会不断拉取一部分数据放入到缓冲区,进行聚合处理; 当map端数据特别大时,reduce端的task拉取数据是可能全部的缓冲区都满了,此时进行reduce聚合处理时创 阅读全文
posted @ 2017-02-28 17:52 YL10000 阅读(620) 评论(0) 推荐(0) 编辑