2014 年 11月随笔档案 - 有无之中

${mapred.local.dir}选择策略--Map Task存放中间结果

摘要：上篇说了block在DataNode配置有多个${dfs.data.dir}时的存储策略，本文主要介绍TaskTracker在配置有多个${mapred.local.dir}时的选择策略。1 mapred-site.xml2 3 mapred.local.dir4 /mnt/locald... 阅读全文

posted @ 2014-11-26 21:36 有无之中阅读(2636) 评论(0) 推荐(0)

HDFS读写数据块--${dfs.data.dir}选择策略

摘要：最近工作需要，看了HDFS读写数据块这部分。不过可能跟网上大部分帖子不一样，本文主要写了${dfs.data.dir}的选择策略，也就是block在DataNode上的放置策略。我主要是从我们工作需要的角度来读这部分代码的。 1 hdfs-site.xml2 3 dfs.data.dir4... 阅读全文

posted @ 2014-11-26 18:27 有无之中阅读(4001) 评论(0) 推荐(0)

hadoop分片分析

摘要：上一篇分析了split的生成，现在接着来说具体的split具体内容及其相关的文件和类。以FileSplit(mapred包下org/apache/hadoop/mapreduce/lib/input/FileSplit.java)为例，它继承了InputSplit接口，包括以下属性：1 publ... 阅读全文

posted @ 2014-11-26 15:37 有无之中阅读(2168) 评论(0) 推荐(0)

hadoop输入分片计算(Map Task个数的确定)

摘要：作业从JobClient端的submitJobInternal()方法提交作业的同时，调用InputFormat接口的getSplits()方法来创建split。默认是使用InputFormat的子类FileInputFormat来计算分片，而split的默认实现为FileSplit(其父接口为... 阅读全文

posted @ 2014-11-21 22:11 有无之中阅读(6144) 评论(0) 推荐(0)

hadoop运行原理之Job运行(五) 任务调度

摘要：接着上篇来说。hadoop首先调度辅助型task(job-cleanup task、task-cleanup task和job-setup task)，这是由JobTracker来完成的；但对于计算型task，则是由作业调度器TaskScheduler来分配的，其默认实现为JobQueueTas... 阅读全文

posted @ 2014-11-09 17:54 有无之中阅读(1330) 评论(0) 推荐(0)

公告