摘要: 这是有疑惑的一个问题,因为在董西成的《Hadoop技术内幕——深入解析MapReduce架构设计与实现原理》中提到这个值是64M,而《Hadoop权威指南》中却说是128M,到底哪个是对的呢?我觉得应该都是对的,可能是版本不同导致的不一致,后面终于在Stack OverFlow找到了答案:在Apache Hadoop中默认是64M,Cloudera Hadoop版本中默认是128M。ps:顺便说一... 阅读全文
posted @ 2018-04-18 10:52 大师兄啊哈 阅读(8115) 评论(0) 推荐(1)
摘要: 一、1.0版本主要由两部分组成:编程模型和运行时环境。编程模型为用户提供易用的编程接口,用户只需编写串行程序实现函数来实现一个分布式程序,其他如节点间的通信、节点失效,数据切分等,则由运行时环境完成。基本编程模型将问题抽象成Map和Reduce两个阶段,Map阶段将输入数据解析成key/value,迭代调用map()函数后,再以key/value的形式输出到本地目录;Reduce阶段则将key相同... 阅读全文
posted @ 2018-04-18 10:14 大师兄啊哈 阅读(2490) 评论(0) 推荐(0)