07 2014 档案

摘要:1 节点说明IPRole192.168.1.111ActiveNameNode192.168.1.112StandbyNameNode,Master,Worker192.168.1.113DataNode,Master,Worker192.168.1.114DataNode,WorkerHDFS集群... 阅读全文
posted @ 2014-07-16 21:36 Scott007 阅读(5118) 评论(2) 推荐(5)
摘要:4.4 Reduce类4.4.1 Reduce介绍整完了Map,接下来就是Reduce了。YarnChild.main()—>ReduceTask.run()。ReduceTask.run方法开始和MapTask类似,包括initialize()初始化,根据情况看是否调用runJobCleanupT... 阅读全文
posted @ 2014-07-13 15:55 Scott007 阅读(1383) 评论(0) 推荐(2)
摘要:4.3 Map类 创建Map类和map函数,map函数是org.apache.hadoop.mapreduce.Mapper类中的定义的,当处理每一个键值对的时候,都要调用一次map方法,用户需要覆写此方法。此外还有setup方法和cleanup方法。map方法是当map任务开始运行的时候调用一次,... 阅读全文
posted @ 2014-07-12 16:36 Scott007 阅读(2436) 评论(1) 推荐(1)
摘要:1 概述该瞅瞅MapReduce的内部运行原理了,以前只知道个皮毛,再不搞搞,不然怎么死的都不晓得。下文会以2.4版本中的WordCount这个经典例子作为分析的切入点,一步步来看里面到底是个什么情况。2 为什么要使用MapReduceMap/Reduce,是一种模式,适合解决并行计算的问题,比如T... 阅读全文
posted @ 2014-07-10 22:29 Scott007 阅读(3078) 评论(3) 推荐(2)