摘要:
1.hadoop DistributedCache使用。Hadoop有一个叫做分布式缓存(distributed cache)的机制来将数据分发到集群上的所有节点上。为了节约网络带宽,在每一个作业中,各个文件通常只需要复制到一个节点一次。缓存文件复制位置:mapred-site.xml中mapred.local.dir/home/hadoop/tmp操作步骤:1.将数据的分发到每个节点上:Configuration conf = new Configuration();DistributedCache.addCacheFile(new URI("/user/hadoop/input/ 阅读全文
posted @ 2013-12-11 10:11
hequn8128
阅读(452)
评论(0)
推荐(0)
浙公网安备 33010602011771号