随笔分类 -  Hadoop

摘要:简单的来说分为四个阶段:InputFormat/MapTask/Shuffle/ReduceTaskInputFormat: 输入文件 --> 转化 --> <K, V>MapTask : <K, V>--> map处理 --> <K', V'>Shuffle : <K', V'> --> Sort and Group --><K', List(V')>ReduceTask: <K', List(V')> --> Re 阅读全文
posted @ 2012-09-25 11:02 雲端之風 阅读(202) 评论(0) 推荐(0)